DOI: https://doi.org/10.2196/47826
PMID: https://pubmed.ncbi.nlm.nih.gov/38512326
تاريخ النشر: 2024-03-21
المؤلف: Annika Molenaar وآخرون
الموضوع الرئيسي: أمن الغذاء والصحة في السكان المتنوعين
نظرة عامة
تستقصي الدراسة تطبيق تقنيات معالجة اللغة الطبيعية (NLP)، وتحديداً تحليل المشاعر ونمذجة الموضوعات، لتحليل بيانات وسائل التواصل الاجتماعي المتعلقة بالأمن الغذائي في أستراليا من 1 يناير 2019 إلى 31 ديسمبر 2021. باستخدام مجموعة بيانات تضم 38,070 تغريدة من 14,880 مستخدمًا، تكشف الأبحاث أن المشاعر العامة بشأن الأمن الغذائي كانت إيجابية في الغالب، خاصة خلال فترات الإغلاق بسبب COVID-19. حددت نمذجة الموضوعات عشرة مواضيع رئيسية، حيث أظهرت “التبرع لبنوك الطعام” أعلى مشاعر إيجابية و”انعدام الأمن الغذائي العالمي” تعكس أكثر المشاعر سلبية. ومن الجدير بالذكر أن التغريدات السلبية حصلت على تفاعل أكبر بكثير من الإيجابية، مما يدل على علاقة معقدة بين المشاعر والموضوعات والتفاعل العام.
تؤكد النتائج على إمكانيات أدوات معالجة اللغة الطبيعية لتعزيز فهم القضايا الصحية العامة مثل الأمن الغذائي. بينما ظلت المشاعر الإيجابية قوية طوال فترة الوباء، تسلط الدراسة الضوء على الحاجة إلى مجموعات بيانات أوسع وتفسير من الخبراء لإبلاغ صنع القرار القائم على الأدلة في الصحة العامة بشكل فعال. تشير الطبيعة المتطورة للنقاشات حول الأمن الغذائي، خاصة استجابةً للأحداث الكبيرة، إلى أن التحليل المستمر أمر حاسم لالتقاط ديناميكيات المشاعر العامة والتفاعل في هذا المجال الحيوي.
مقدمة
تناقش مقدمة ورقة البحث الدور المهم لوسائل التواصل الاجتماعي في تشكيل الخطاب العام حول القضايا الصحية، وخاصة الأمن الغذائي، الذي يُعرف بأنه توفر الوصول إلى غذاء كافٍ وآمن ومغذي. يبرز المؤلفون إمكانيات علم البيانات وتعلم الآلة، وخاصة معالجة اللغة الطبيعية (NLP)، لتحليل كميات هائلة من بيانات وسائل التواصل الاجتماعي. يمكن أن تصنف هذه التقنيات النقاشات، وتتبع المشاعر العامة، وتحديد المعلومات المضللة، مما يُعلم ممارسات وسياسات الصحة العامة. تم تقديم مفاهيم علم الأوبئة المعلوماتية والمراقبة المعلوماتية كأطر لاستخدام المعلومات عبر الإنترنت لمراقبة الاتجاهات الصحية والمعلومات المضللة، خاصة في سياق جائحة COVID-19.
تؤكد الورقة على الزيادة المتزايدة في انعدام الأمن الغذائي على مستوى العالم، خاصة في البلدان ذات الدخل المنخفض والمتوسط، وآثارها الضارة على الصحة والتغذية. على الرغم من الاعتراف بالأمن الغذائي كقضية صحية عامة حاسمة، خاصة في سياق أهداف التنمية المستدامة للأمم المتحدة، يشير المؤلفون إلى نقص الاستجابات المنسقة في البلدان ذات الدخل المرتفع مثل أستراليا. يجادلون بضرورة استراتيجيات مبتكرة واستكشاف مصادر البيانات في الوقت الحقيقي لفهم ومعالجة تحديات الأمن الغذائي بشكل أفضل، مقترحين أن تعلم الآلة وNLP يمكن أن يوفر رؤى قيمة حول العوامل المعقدة التي تؤثر على الوصول إلى الغذاء والأمن.
الطرق
تحدد قسم “الطرق” الأساليب التجريبية والتحليلية المستخدمة في الدراسة. استخدم الباحثون مزيجًا من التقنيات الكمية والنوعية لجمع البيانات، مما يضمن تحليلًا شاملاً للموضوع. شملت المنهجيات المحددة تجارب محكومة، ونمذجة إحصائية، وجمع البيانات من خلال الاستطلاعات أو الدراسات الملاحظة، اعتمادًا على سؤال البحث.
لتحليل البيانات، طبق الفريق اختبارات إحصائية متنوعة، مثل تحليل الانحدار واختبار الفرضيات، لتحديد أهمية نتائجهم. بالإضافة إلى ذلك، تضمنت الطرق أدوات حسابية متقدمة لمعالجة البيانات، مما سهل التعامل مع مجموعات البيانات الكبيرة وزاد من دقة النتائج. بشكل عام، تم تصميم الإطار المنهجي لاختبار الفرضيات بدقة وتقديم استنتاجات قوية بناءً على الأدلة التجريبية.
النتائج
استخدمت الدراسة تقنيات معالجة اللغة الطبيعية (NLP)، وتحديداً تحليل المشاعر ونمذجة الموضوعات، للتحقيق في النقاشات المحيطة بالأمن الغذائي على تويتر في أستراليا على مدار ثلاث سنوات. تكشف النتائج أن المشاعر العامة تجاه الأمن الغذائي كانت إيجابية في الغالب، مع ملاحظات متغيرة شهريًا. ومن الجدير بالذكر أن المشاعر الإيجابية ظلت مرتفعة خلال فترات الإغلاق بسبب COVID-19، بينما كانت المشاعر المتطرفة نادرة، وكانت المشاعر المحايدة عمومًا أقل من كل من المشاعر الإيجابية والسلبية، باستثناء زيادة في أغسطس 2021.
حددت نمذجة الموضوعات عشرة مواضيع متماسكة تتعلق بالأمن الغذائي، حيث برز “الإنتاج العالمي” كأكثرها بروزًا، مرتبطًا ارتباطًا وثيقًا بـ “تغير المناخ”. تضمنت المواضيع المهمة الأخرى الإغاثة الغذائية وبنوك الطعام، مع معالجة جوانب مثل الصحة العامة، والتطوع، ودعم الحكومة. من بين هذه المواضيع، أظهرت “التبرع لبنوك الطعام” أعلى مشاعر إيجابية، بينما ارتبط “انعدام الأمن الغذائي العالمي” بأكثر المشاعر سلبية. أشارت مقاييس التفاعل إلى أن التغريدات السلبية حصلت على مزيد من التفاعل في 2019 و2020 مقارنةً بـ 2021، بينما جذب “الإنتاج العالمي”، على الرغم من كونه الموضوع الأكثر مناقشة، تفاعلًا أقل بكثير. لم تكشف التحليلات عن علاقة متسقة بين المشاعر السائدة للمواضيع ومعدلات تفاعلها.
المناقشة
تسلط قسم المناقشة في ورقة البحث الضوء على الطبيعة متعددة الأبعاد للأمن الغذائي، خاصة في السياق الأسترالي، وتؤكد على الاستخدام المبتكر لتقنيات معالجة اللغة الطبيعية (NLP)، وتحديداً تحليل المشاعر والموضوعات، لتحليل بيانات وسائل التواصل الاجتماعي. تهدف الدراسة إلى الاستفادة من الرؤى الواقعية من تويتر لإبلاغ صنع القرار في الصحة العامة بشأن الأمن الغذائي، خاصة في ضوء جائحة COVID-19. من خلال اعتماد عملية تطوير مصطلحات بحث تكرارية، قام الباحثون بتحسين استراتيجيتهم لجمع البيانات لالتقاط التغريدات ذات الصلة، وجمعوا في النهاية مجموعة بيانات تضم 38,070 تغريدة من 14,880 مستخدمًا أستراليًا فريدًا على مدار ثلاث سنوات.
كشفت التحليلات عن اتجاهات كبيرة في تطور المشاعر والمواضيع بمرور الوقت، حيث كانت المشاعر الإيجابية تسود بشكل عام، خاصة خلال فترات الدعم الحكومي والاستقرار النسبي. على العكس من ذلك، ارتفعت المشاعر السلبية خلال الأزمات، مثل حرائق الغابات الأسترالية وبداية جائحة COVID-19. حددت نمذجة الموضوعات عشرة مواضيع رئيسية، حيث كانت “الإنتاج العالمي” و”انعدام الأمن الغذائي والصحة” الأكثر بروزًا. تؤكد الدراسة على إمكانيات استخدام بيانات وسائل التواصل الاجتماعي للمراقبة المعلوماتية في الصحة العامة، مقترحة أن الرؤى في الوقت الحقيقي يمكن أن تعزز استجابة التدخلات التي تهدف إلى معالجة تحديات الأمن الغذائي.
القيود
تقدم الدراسة عدة قيود يجب أخذها بعين الاعتبار عند تفسير نتائجها. أولاً، استخدمت فقط بيانات تويتر كمصدر وحيد لوسائل التواصل الاجتماعي، مما قد لا يمثل بدقة السكان الأوسع. يميل مستخدمو تويتر إلى أن يكونوا أصغر سناً، وغالبًا ما يكونون من الذكور، وأكثر انخراطًا سياسيًا من غير المستخدمين، مما قد يشوه وجهات النظر الملتقطة في التحليل. بالإضافة إلى ذلك، فإن الانخفاض في شعبية تويتر، الذي لوحظ بعد فترة جمع البيانات، يثير مخاوف بشأن قابلية تعميم النتائج.
ثانيًا، تحليل المشاعر المستخدم، VADER، محدود بسبب عدم قدرته على حساب الفروق السياقية في اللغة، خاصة في مجالات التغذية والأمن الغذائي. قد تؤثر هذه القصور في الوعي السياقي على دقة تفسير المشاعر. علاوة على ذلك، قد تكون التغريدات المنشورة في وقت لاحق من فترة جمع البيانات قد تلقت تفاعلاً أقل بسبب قيود الوقت، على الرغم من أن معظم التفاعل يحدث عادةً بعد فترة قصيرة من النشر. أخيرًا، قدرة الدراسة على استخلاص استنتاجات قاطعة حول العلاقة بين المقالات الإخبارية وظهور المشاعر أو الموضوعات محدودة، حيث لا يمكنها تحديد ما إذا كانت الأحداث المحددة هي المحركات الرئيسية للنقاشات ضمن مجموعة البيانات الواسعة.
DOI: https://doi.org/10.2196/47826
PMID: https://pubmed.ncbi.nlm.nih.gov/38512326
Publication Date: 2024-03-21
Author(s): Annika Molenaar et al.
Primary Topic: Food Security and Health in Diverse Populations
Overview
The study investigates the application of natural language processing (NLP) techniques, specifically sentiment analysis and topic modeling, to analyze social media data concerning food security in Australia from January 1, 2019, to December 31, 2021. Utilizing a dataset of 38,070 tweets from 14,880 users, the research reveals that overall sentiment regarding food security was predominantly positive, particularly during COVID-19 lockdowns. The topic modeling identified ten key themes, with “Giving to food banks” exhibiting the highest positive sentiment and “Global food insecurity” reflecting the most negative sentiment. Notably, negative tweets garnered significantly higher engagement than positive ones, indicating a complex relationship between sentiment, topic, and public engagement.
The findings underscore the potential of NLP tools to enhance understanding of public health issues like food security. While positive sentiment remained resilient throughout the pandemic, the study highlights the need for broader datasets and expert interpretation to effectively inform evidence-based decision-making in public health. The evolving nature of discussions around food security, particularly in response to significant events, suggests that ongoing analysis is crucial for capturing the dynamics of public sentiment and engagement in this critical area.
Introduction
The introduction of the research paper discusses the significant role of social media in shaping public discourse on health issues, particularly food security, which is defined as the availability and access to sufficient, safe, and nutritious food. The authors highlight the potential of data science and machine learning, especially natural language processing (NLP), to analyze vast amounts of social media data. These techniques can classify discussions, track public sentiment, and identify misinformation, thereby informing public health practices and policies. The concepts of infodemiology and infoveillance are introduced as frameworks for utilizing online information to monitor health trends and misinformation, particularly in the context of the COVID-19 pandemic.
The paper emphasizes the increasing prevalence of food insecurity globally, particularly in low- and middle-income countries, and its detrimental effects on health and nutrition. Despite the recognition of food security as a critical public health issue, especially in the context of the United Nations Sustainable Development Goals, the authors note a lack of coordinated responses in high-income countries like Australia. They argue for the necessity of innovative strategies and the exploration of real-time data sources to better understand and address food security challenges, suggesting that machine learning and NLP can provide valuable insights into the complex factors influencing food access and security.
Methods
The “Methods” section outlines the experimental and analytical approaches employed in the study. The researchers utilized a combination of quantitative and qualitative techniques to gather data, ensuring a comprehensive analysis of the subject matter. Specific methodologies included controlled experiments, statistical modeling, and data collection through surveys or observational studies, depending on the research question.
To analyze the data, the team applied various statistical tests, such as regression analysis and hypothesis testing, to determine the significance of their findings. Additionally, the methods incorporated advanced computational tools for data processing, which facilitated the handling of large datasets and enhanced the accuracy of the results. Overall, the methodological framework was designed to rigorously test the hypotheses and provide robust conclusions based on empirical evidence.
Results
The study employed natural language processing (NLP) techniques, specifically sentiment analysis and topic modeling, to investigate discussions surrounding food security on Twitter in Australia over a three-year period. The findings reveal that the overall sentiment towards food security was predominantly positive, with variations observed monthly. Notably, positive sentiment remained elevated during the COVID-19 lockdowns, while extreme sentiments were infrequent, and neutral sentiment was generally lower than both positive and negative sentiments, except for a spike in August 2021.
A topic model identified ten coherent topics related to food security, with “Global production” emerging as the most prominent, closely associated with “Climate change.” Other significant topics included food relief and food banks, addressing aspects such as public health, volunteerism, and government support. Among these topics, “Giving to food banks” exhibited the highest positive sentiment, whereas “Global food insecurity” was linked to the most negative sentiment. Engagement metrics indicated that negative tweets garnered more interaction in 2019 and 2020 compared to 2021, while “Global production,” despite being the most frequently discussed topic, attracted considerably lower engagement. The analysis did not reveal a consistent correlation between the predominant sentiment of topics and their engagement rates.
Discussion
The discussion section of the research paper highlights the multifaceted nature of food security, particularly within the Australian context, and emphasizes the innovative use of Natural Language Processing (NLP) techniques, specifically sentiment and topic analysis, to analyze social media data. The study aims to leverage real-world insights from Twitter to inform public health decision-making regarding food security, especially in light of the COVID-19 pandemic. By employing an iterative search term development process, the researchers refined their data collection strategy to capture relevant tweets, ultimately gathering a dataset of 38,070 tweets from 14,880 unique Australian users over three years.
The analysis revealed significant trends in sentiment and topic evolution over time, with positive sentiment predominating overall, particularly during periods of governmental support and relative stability. Conversely, negative sentiment spiked during crises, such as the Australian bushfires and the onset of the COVID-19 pandemic. Topic modeling identified ten key themes, with “Global production” and “Food insecurity and health” being the most prominent. The study underscores the potential of using social media data for infoveillance in public health, suggesting that real-time insights can enhance the responsiveness of interventions aimed at addressing food security challenges.
Limitations
The study presents several limitations that must be considered when interpreting its findings. Firstly, it exclusively utilized Twitter data as the sole social media source, which may not accurately represent the broader population. Twitter users tend to be younger, predominantly male, and more politically engaged than non-users, potentially skewing the perspectives captured in the analysis. Additionally, the decline in Twitter’s popularity, noted after the data collection period, raises concerns about the generalizability of the results.
Secondly, the sentiment analysis employed, VADER, is limited by its inability to account for contextual nuances in language, particularly in the domains of nutrition and food security. This lack of contextual awareness may affect the accuracy of sentiment interpretation. Furthermore, tweets posted later in the data collection period may have received less engagement due to time constraints, although most engagement typically occurs shortly after posting. Lastly, the study’s ability to draw definitive conclusions about the relationship between news articles and sentiment or topic occurrences is limited, as it cannot ascertain whether specific events were the primary drivers of discussions within the extensive dataset.
