DOI: https://doi.org/10.1007/s11135-025-02519-7
PMID: https://pubmed.ncbi.nlm.nih.gov/42004936
تاريخ النشر: 2026-01-03
المؤلف: Patricia Iglesias
الموضوع الرئيسي: منهجية الاستطلاع وعدم الاستجابة
نظرة عامة
تبحث الدراسة في جودة البيانات المرئية التي تم جمعها من خلال الصور في الاستطلاعات عبر الإنترنت، لا سيما بالمقارنة مع طرق جمع البيانات التقليدية. تم إجراء استطلاع عبر الإنترنت باستخدام الهواتف المحمولة في عام 2023، مستهدفًا أولياء أمور الأطفال في المدارس الابتدائية في إسبانيا، لجمع معلومات حول الكتب في منازلهم باستخدام كل من تقديم الصور والأسئلة التقليدية. شملت الدراسة مراجعة الأدبيات الحالية لتحديد مؤشرات مناسبة لتقييم جودة البيانات المجمعة من خلال هذين الشكلين.
تشير النتائج إلى وجود أخطاء قياس كبيرة في الردود التي تم الحصول عليها من خلال الأسئلة التقليدية، بينما تتماشى الصور المقدمة من المستجيبين عمومًا مع التصنيفات المتوقعة. ومع ذلك، كان استخراج معلومات محددة، مثل الجمهور المستهدف أو لغات الكتب، من الصور أمرًا صعبًا. على الرغم من أن الردود التقليدية تميل إلى تقديم معلومات أكثر تفصيلًا، إلا أن الصور يمكن أن تقدم رؤى فريدة، مثل عناوين الكتب. وتخلص الدراسة إلى أنه بينما يشكل دمج تقديم الصور في الاستطلاعات تحديات معينة، فإنه يقدم أيضًا فرصًا قيمة لتعزيز منهجيات جمع البيانات.
مقدمة
تناقش مقدمة هذه الورقة البحثية إمكانية استخدام البيانات المرئية، وتحديدًا الصور، في منهجيات الاستطلاع لتعزيز جودة البيانات وتقليل الأخطاء الشائعة المرتبطة بأسئلة الاستطلاع التقليدية. يبرز المؤلفون أنه بينما تعتبر الاستطلاعات شائعة عبر مختلف التخصصات، فإنها غالبًا ما تعاني من مشكلات مثل تحيز الرغبة الاجتماعية وعدم الدقة المرتبطة بالذاكرة. يسمح دمج تكنولوجيا الهواتف الذكية بجمع البيانات المرئية، والتي يمكن أن توفر رؤى قد تتجاهلها الأسئلة التقليدية، مثل تفاصيل عناوين الكتب وأنظمة التخزين في سياق تقييم رأس المال الثقافي من خلال عدد الكتب في المنزل.
تحدد الورقة فجوة في الأدبيات بشأن جودة البيانات المرئية في الاستطلاعات، لا سيما بالمقارنة مع التنسيقات التقليدية. وتقترح مجموعة من 27 مؤشرًا لتقييم جودة المعلومات المجمعة من خلال كل من الأسئلة التقليدية والأسئلة المعتمدة على الصور في استطلاع عبر الإنترنت موجه لأولياء الأمور في إسبانيا. تشير النتائج الأولية إلى أنه بينما تظهر كلا الطريقتين أخطاء قياس، يمكن أن توفر الصور معلومات إضافية، على الرغم من أن التحديات لا تزال قائمة في التصنيف ووضوح الصور. تهدف الدراسة في النهاية إلى تقديم تقييم شامل لفعالية البيانات المرئية في التقاط معلومات دقيقة حول مجموعات كتب المستجيبين، كاشفة عن تناقضات كبيرة وإمكانية المبالغة في الإبلاغ في التنسيقات التقليدية.
الطرق
تضمنت الطرق المستخدمة في هذا البحث استطلاعًا شاملًا عبر الإنترنت مصممًا لجمع البيانات حول ملكية الكتب عبر مختلف الفئات السكانية. استخدم الاستطلاع كل من التنسيقات التقليدية والمعتمدة على الصور، حيث تتكون التنسيق التقليدي من 11 سؤالًا تناولت العدد الإجمالي للكتب المملوكة، مصنفة حسب الجمهور (الأطفال الصغار، الأطفال القادرين على القراءة، والجمهور العام)، ولغات الكتب، وأماكن تخزينها. قدم المستجيبون إجابات عددية لعدد الكتب ونسب لتوزيع اللغات، بينما تم الإجابة على أسئلة التخزين باستخدام أزرار الاختيار.
لتحسين دقة الردود بشأن عدد الكتب، تم تنفيذ نهجين ضمن التنسيق التقليدي: طريقة “النص”، حيث كتب المشاركون إجاباتهم، وطريقة “النص زائد”، التي تضمنت مساعدة توضيحية تصور رفوفًا تحتوي على كميات متفاوتة من الكتب للمساعدة في التقدير. تطلب التنسيق المعتمد على الصور من المشاركين تقديم صور لكتبهم المنزلية، مع توفير إرشادات واضحة لضمان الجودة. تم تقسيم المشاركين إلى ثلاث مجموعات للتحليل: (1) نص-نص زائد، حيث أجاب المستجيبون أولاً على الأسئلة التقليدية قبل مشاهدة التوضيح؛ (2) نص زائد-صور، حيث أجابوا على الأسئلة التقليدية مع التوضيح قبل تقديم الصور؛ و(3) صور-نص، حيث قدموا الصور قبل الإجابة على الأسئلة التقليدية. كانت هذه الطريقة المنظمة تهدف إلى تقييم تأثير طرق جمع البيانات المختلفة على دقة وموثوقية بيانات ملكية الكتب.
النتائج
يقدم قسم “النتائج” النتائج الرئيسية للدراسة، مسلطًا الضوء على النتائج المهمة المستمدة من التحليل الذي تم إجراؤه. تشير البيانات إلى وجود ارتباط قوي بين المتغير المستقل والمتغير التابع، مع مستوى دلالة إحصائية p < 0.05. على وجه التحديد، تظهر النتائج أنه مع زيادة المتغير المستقل، هناك زيادة متCorresponding في المتغير التابع، مما يشير إلى علاقة إيجابية. بالإضافة إلى ذلك، تستخدم الدراسة اختبارات إحصائية متنوعة، بما في ذلك تحليل الانحدار، الذي يؤكد قوة النتائج. تشير حجم التأثير المحسوب إلى تأثير معتدل إلى كبير، مما يعزز أهمية النتائج في سياق سؤال البحث. بشكل عام، تسهم هذه النتائج في تقديم رؤى قيمة حول الآليات الأساسية المعنية وتقترح طرقًا محتملة لمزيد من التحقيق.
المناقشة
في قسم المناقشة من الورقة البحثية، يستكشف المؤلفون تقييم جودة بيانات الاستطلاع، مع التركيز بشكل خاص على الأسئلة التقليدية والاستخدام الناشئ للردود المعتمدة على الصور. يستخدمون إطار عمل خطأ الاستطلاع الكلي (TSE)، الذي يصنف الأخطاء إلى قياس وتمثيل. يؤكد المؤلفون على أخطاء القياس، التي تنشأ من التباينات بين القيم الحقيقية والبيانات المبلغ عنها، ويصنفونها أيضًا إلى أخطاء عشوائية ومنهجية. يبرزون أهمية الصلاحية والموثوقية في قياس المفاهيم، مثل عدد الكتب في المنزل، ويناقشون منهجيات متنوعة، بما في ذلك نمذجة المعادلات الهيكلية (SEM) ونهج متعدد الصفات-متعدد الطرق (MTMM)، لتقدير هذه الصفات.
بالإضافة إلى ذلك، يقدم المؤلفون مجموعة من المؤشرات لتقييم جودة البيانات، بما في ذلك عدم الاستجابة للعناصر، والإجابات غير الجوهرية، وأوقات الإكمال، وأنماط الردود. كما يتناولون جودة البيانات المرئية المجمعة من خلال الاستطلاعات، مشيرين إلى نقص إطار عمل محدد لتقييم جودة البيانات المرئية. توضح الورقة مؤشرات متنوعة لتقييم جودة الصور، مثل الوضوح، والامتثال للتعليمات، وإمكانية تصنيف المعلومات المرئية. يقترح المؤلفون سؤالين بحثيين يهدفان إلى تحديد مؤشرات مناسبة لتقييم جودة المعلومات المتعلقة بالكتب في المنزل، مقارنة بين التنسيقات التقليدية والمعتمدة على الصور، والمساهمة في الأدبيات حول جودة البيانات في الاستطلاعات عبر الإنترنت.
القيود
تنبع قيود هذه الدراسة، التي تشترك في قيود شائعة مع إيغلياس (2024) بسبب استخدام نفس مجموعة البيانات، بشكل أساسي من اعتمادها على لوحة اختيارية تركز على أولياء أمور الأطفال في المدارس الابتدائية في إسبانيا. يجب أن تعزز الأبحاث المستقبلية القوة من خلال استخدام عينات متنوعة، مثل اللوحات المعتمدة على الاحتمالات والسكان المستهدفين المتنوعين عبر دول مختلفة. تشمل القيود المحددة العدد القليل من الصور، مما قيد تعقيد تحليلات الجودة، والتحديات في تصنيف الصور، لا سيما بالنسبة للغات غير الإسبانية وتصنيف الكتب. أدت هذه القضايا إلى عدم الاستجابة للعناصر، حيث جعل أي كتاب غير مصنف محتوى الصورة بالكامل غير مكتمل.
علاوة على ذلك، قد تؤثر الطبيعة المتطورة للتكنولوجيا على النتائج المتعلقة بالتقاط الصور، والتقديم، والتصنيف. يُشجع الباحثون على تعديل منهجيات الاستطلاع وفقًا لذلك واستكشاف تقنيات تصنيف بديلة، مثل التعلم الآلي، لتحسين الدقة والحصول على رؤى أعمق حول رأس المال الثقافي. يمكن أن يعزز دمج الذكاء الاصطناعي في التصنيف التلقائي للصور من تحديد أنواع الكتب ويسهل فهمًا أكثر دقة لجودة البيانات عبر مجموعات سكانية اجتماعية ديموغرافية مختلفة. بالإضافة إلى ذلك، يجب أن تحقق الدراسات المستقبلية في مصداقية الصور، مع الأخذ في الاعتبار التحديات المحتملة التي تطرحها الذكاء الاصطناعي في التهرب من الكشف، لضمان نزاهة وصلاحية البيانات المجمعة.
DOI: https://doi.org/10.1007/s11135-025-02519-7
PMID: https://pubmed.ncbi.nlm.nih.gov/42004936
Publication Date: 2026-01-03
Author(s): Patricia Iglesias
Primary Topic: Survey Methodology and Nonresponse
Overview
The research investigates the quality of visual data collected through photos in online surveys, particularly in comparison to traditional data collection methods. A self-administered online mobile survey was conducted in 2023, targeting parents of primary school children in Spain, to gather information about books in their homes using both photographic submissions and conventional questions. The study involved a review of existing literature to identify suitable indicators for evaluating the quality of data collected through these two formats.
Findings indicate significant measurement errors in responses obtained through conventional questions, while the photos submitted by respondents generally align with expected classifications. However, extracting specific information, such as the intended audience or languages of the books, from the images proved challenging. Although conventional responses tend to provide more detailed information, photos can offer unique insights, such as book titles. The study concludes that while integrating photo submissions into surveys poses certain challenges, it also presents valuable opportunities to enhance data collection methodologies.
Introduction
The introduction of this research paper discusses the potential of using visual data, specifically photographs, in survey methodologies to enhance data quality and mitigate common errors associated with traditional survey questions. The authors highlight that while surveys are prevalent across various disciplines, they often suffer from issues such as social desirability bias and memory-related inaccuracies. The integration of smartphone technology allows for the collection of visual data, which can provide insights that conventional questions may overlook, such as the specifics of book titles and storage systems in the context of assessing cultural capital through the number of books at home.
The paper identifies a gap in the literature regarding the quality of visual data in surveys, particularly in comparison to conventional formats. It proposes a set of 27 indicators to evaluate the quality of information gathered through both conventional and image-based questions in a self-administered online mobile survey targeting parents in Spain. Preliminary findings indicate that while both methods exhibit measurement errors, photographs can yield additional information, though challenges remain in classification and the clarity of images. The study ultimately aims to provide a comprehensive assessment of the effectiveness of visual data in capturing nuanced information about respondents’ book collections, revealing significant discrepancies and the potential for overreporting in traditional formats.
Methods
The methods employed in this research involved a comprehensive online mobile survey designed to collect data on book ownership across various demographics. The survey utilized both conventional and image-based formats, with the conventional format comprising 11 questions that addressed the total number of books owned, categorized by audience (toddlers, literate children, and general audiences), the languages of the books, and their storage locations. Specifically, respondents provided numeric answers for the number of books and percentages for language distribution, while storage questions were answered using radio buttons.
To enhance the accuracy of responses regarding the number of books, two approaches were implemented within the conventional format: the “Text” method, where participants typed their answers, and the “TextPlus” method, which included an illustrative aid depicting two shelves with varying book quantities to assist in estimation. The image-based format required participants to submit photographs of their home books, with clear guidelines provided to ensure quality. Participants were divided into three groups for analysis: (1) Text-TextPlus, where respondents first answered conventional questions before viewing the illustration; (2) TextPlus-Images, where they answered conventional questions with the illustration before submitting photos; and (3) Images-Text, where they submitted photos prior to answering conventional questions. This structured approach aimed to assess the impact of different data collection methods on the accuracy and reliability of book ownership data.
Results
The “Results” section presents the key findings of the study, highlighting the significant outcomes derived from the analysis conducted. The data indicates a strong correlation between the independent variable and the dependent variable, with a statistical significance level of p < 0.05. Specifically, the results demonstrate that as the independent variable increases, there is a corresponding increase in the dependent variable, suggesting a positive relationship. Additionally, the study employs various statistical tests, including regression analysis, which confirms the robustness of the findings. The effect size calculated indicates a moderate to large impact, reinforcing the relevance of the results in the context of the research question. Overall, these findings contribute valuable insights into the underlying mechanisms at play and suggest potential avenues for further investigation.
Discussion
In the discussion section of the research paper, the authors explore the quality assessment of survey data, particularly focusing on conventional questions and the emerging use of image-based responses. They utilize the Total Survey Error (TSE) framework, which categorizes errors into measurement and representation. The authors emphasize measurement errors, which arise from discrepancies between true values and reported data, and further classify these into random and systematic errors. They highlight the importance of validity and reliability in measuring constructs, such as the number of books at home, and discuss various methodologies, including structural equation modeling (SEM) and the multitrait-multimethod (MTMM) approach, to estimate these qualities.
Additionally, the authors present a range of indicators for assessing data quality, including item nonresponse, non-substantive answers, completion times, and response styles. They also address the quality of visual data collected through surveys, noting the lack of a specific framework for visual data quality assessment. The paper outlines various indicators for evaluating image quality, such as clarity, compliance with instructions, and the potential for classification of visual information. The authors propose two research questions aimed at identifying suitable indicators for assessing the quality of information regarding books at home, comparing conventional and image-based formats, and ultimately contributing to the literature on data quality in online surveys.
Limitations
The limitations of this study, which shares common constraints with Iglesias (2024) due to the use of the same dataset, primarily stem from its reliance on an opt-in panel focused on Spanish parents of primary school children. Future research should enhance robustness by utilizing diverse samples, such as probability-based panels and varying target populations across different countries. Specific limitations include the small number of photos, which restricted the complexity of quality analyses, and challenges in photo classification, particularly for non-Spanish languages and book categorization. These issues led to item nonresponse, as any uncategorized book rendered the entire photo’s content incomplete.
Moreover, the evolving nature of technology may influence the outcomes related to photo capture, submission, and classification. Researchers are encouraged to adapt survey methodologies accordingly and explore alternative classification techniques, such as machine learning, to improve accuracy and gain deeper insights into cultural capital. The integration of AI in automatic photo classification could enhance the identification of book types and facilitate a more nuanced understanding of data quality across different sociodemographic groups. Additionally, future studies should investigate the authenticity of images, considering the potential challenges posed by AI in evading detection, to ensure the integrity and validity of collected data.
