نهج تعلم عميق لتصنيف وتوقع الحالة الغذائية للأطفال في إثيوبيا باستخدام شبكات LSTM-FC العصبية
A deep learning approach for classifying and predicting children’s nutritional status in Ethiopia using LSTM-FC neural networks

المجلة: BioData Mining، المجلد: 18، العدد: 1
DOI: https://doi.org/10.1186/s13040-025-00425-0
PMID: https://pubmed.ncbi.nlm.nih.gov/39885567
تاريخ النشر: 2025-01-30
المؤلف: Getnet Bogale Begashaw وآخرون
الموضوع الرئيسي: تغذية الأطفال والوصول إلى المياه

نظرة عامة

تدرس هذه الدراسة تطبيق الشبكات العصبية المتصلة بالكامل من نوع الذاكرة طويلة وقصيرة الأمد (LSTM-FC) لتصنيف وتوقع الحالة الغذائية للأطفال في إثيوبيا، مع معالجة القضية الملحة للصحة العامة المتعلقة بسوء التغذية. باستخدام بيانات طولية من دراسة مجموعة حياة الشباب، التي تتبعت 1,997 طفلًا من 2002 إلى 2016، تستخدم البحث تقنيات معالجة بيانات صارمة، بما في ذلك التطبيع واختيار الميزات عبر SHapley Additive exPlanations. تم تحسين أداء النموذج من خلال ضبط المعلمات الفائقة، وتشير النتائج إلى أن نموذج LSTM-FC يتفوق بشكل كبير على النماذج الأساسية، محققًا معدلات دقة تصنيف تتجاوز 93% ويظهر تعميمًا قويًا عبر فئات غذائية مختلفة.

تكشف النتائج عن اتجاه مقلق في تغذية الأطفال، مع انخفاض في الحالة الغذائية الطبيعية بين الذكور من 58.3% عند سن 5 إلى 33.5% بحلول سن 25، إلى جانب زيادة في حالات سوء التغذية الشديدة من 1.3% إلى 9.4%. تبرز الدراسة فعالية نموذج LSTM-FC في تحديد الحالات الغذائية بدقة، لا سيما لفئات التغذية الطبيعية والمهدرة، مع الإشارة أيضًا إلى أخطاء توقع طفيفة. تؤكد هذه النتائج على الحاجة الملحة لتدخلات الصحة العامة المستهدفة لمكافحة ارتفاع معدلات سوء التغذية في إثيوبيا، خاصة في ضوء التحديات المستمرة المتعلقة بالوصول إلى الرعاية الصحية، انعدام الأمن الغذائي، وعدم الاستقرار الاجتماعي والسياسي.

مقدمة

تتناول مقدمة هذه الورقة البحثية القضية الحرجة للصحة العالمية المتعلقة بسوء التغذية لدى الأطفال، والتي تتميز بعدم كفاية تناول العناصر الغذائية مما يؤدي إلى قصر القامة، وضعف جهاز المناعة، وتأخر في النمو. تصنف معايير النمو لمنظمة الصحة العالمية (WHO) سوء التغذية إلى ثلاثة أنواع: نقص الوزن، قصر القامة، والهزال. بشكل مقلق، يُعاني حوالي 149 مليون طفل دون سن الخامسة من قصر القامة على مستوى العالم، مع تركيزات كبيرة في آسيا وأفريقيا جنوب الصحراء الكبرى. على الرغم من الانخفاض الطفيف في انتشار قصر القامة في أفريقيا جنوب الصحراء من 2012 إلى 2019، إلا أن المعدلات لا تزال مرتفعة بشكل غير مقبول، وتفوق وفيات الأطفال المرتبطة بسوء التغذية تلك الناتجة عن الإسهال والالتهاب الرئوي مجتمعة.

تسلط الورقة الضوء على قيود الأساليب الإحصائية التقليدية في تحليل سوء التغذية لدى الأطفال، لا سيما عدم قدرتها على إدارة الاعتماديات طويلة الأمد في البيانات التسلسلية. بالمقابل، توفر الشبكات العصبية من نوع الذاكرة طويلة وقصيرة الأمد (LSTM)، وهي نوع متخصص من الشبكات العصبية المتكررة (RNN)، قدرات محسنة لالتقاط الأنماط الزمنية المعقدة وتحسين توقعات الحالة الغذائية للأطفال. على الرغم من أن LSTMs قد تم تطبيقها بنجاح في سياقات صحية متنوعة، إلا أن استخدامها في تقييم النتائج الغذائية المتزامنة بين الأطفال لا يزال غير مستكشف بشكل كاف، لا سيما في إثيوبيا. تهدف هذه الدراسة إلى تقييم فعالية شبكة LSTM-FC العصبية مقارنة بالنماذج التقليدية مثل المتوسط المتحرك التكاملي الذاتي (ARIMA) وغابة عشوائية (RF) في توقع سوء التغذية بين الأطفال دون سن 15، مع التأكيد على أهمية فهم الاتجاهات الغذائية مع انتقال الأطفال إلى مرحلة المراهقة. تم هيكلة الورقة لتقديم الخلفية، المنهجية، النتائج، والمناقشات، مما يؤدي إلى رؤى وتوصيات للبحوث المستقبلية.

طرق

في هذا القسم، يتم تقييم أداء نموذج LSTM-FC مقابل طرق أساسية مختلفة لتوقع الحالة الغذائية للأطفال عبر مراحل التطور المختلفة. تسلط الدراسة الضوء على أن النماذج المعتمدة على الشبكات العصبية، لا سيما LSTM-FC وBi-LSTM، تتفوق بشكل كبير على النماذج التقليدية مثل غابة عشوائية (RF)، المتوسط المتحرك التكاملي الذاتي (ARIMA)، الشبكة العصبية المتكررة (RNN)، ووحدة التكرار المغلقة (GRU) من حيث دقة التوقع والدقة. على سبيل المثال، في مهمة توقع الحالة الغذائية لعام 2016، حقق نموذج LSTM-FC وBi-LSTM دقة أعلى بحوالي 36% و34% مقارنة بنموذج ARIMA، مع تحسينات في الدقة تبلغ حوالي 25% و23%، على التوالي.

أظهر نموذج LSTM-FC أداءً متفوقًا عبر مقاييس تقييم مختلفة—بما في ذلك الدقة، الدقة، الاسترجاع، وF1-score—محققًا باستمرار أعلى القيم بغض النظر عن أفق التوقع. على وجه التحديد، حقق دقة إجمالية قدرها 93.4%، ودقة قدرها 91.4%، واسترجاع قدره 89.8%، وF1-score قدره 90.2%، مما يشير إلى قوته وملاءمته لكل من التوقعات قصيرة الأمد وطويلة الأمد. تتوفر مقاييس الأداء التفصيلية لكل نموذج في المواد التكميلية، مما يعزز فعالية نموذج LSTM-FC في تقييم الحالة الغذائية للأطفال مقارنة بنظرائه الأساسيين.

نتائج

تشير النتائج إلى وجود تباينات ملحوظة في الحالة الغذائية للأطفال في إثيوبيا عبر مجموعات عمرية مختلفة. خلال مرحلة الطفولة المبكرة (دون سن 2)، تكون نسبة الحالة الغذائية الطبيعية مرتفعة نسبيًا، حيث تم تصنيف 19.37% من الإناث و18.32% من الذكور على أنهم في حالة طبيعية. ومع ذلك، تنخفض هذه النسبة مع دخول الأطفال مرحلة المراهقة المبكرة (الأعمار 12-14)، حيث تنخفض إلى 15.12% للإناث و16.63% للذكور.

على النقيض من ذلك، تتزايد حالات سوء التغذية الشديدة، التي تشمل حالات مثل نقص الوزن، قصر القامة، والهزال، مع تقدم العمر. بشكل خاص، تشهد مرحلة المراهقة المتوسطة (الأعمار 14-18) زيادة كبيرة في سوء التغذية الشديدة بين الذكور، حيث تصل إلى 47.59%. ومع ذلك، تواجه الإناث تحديًا أكثر وضوحًا في وقت مبكر، حيث تتأثر 52.34% خلال مرحلة المراهقة المبكرة. تتوفر إحصائيات مفصلة في المواد التكميلية، تحديدًا في الجدول S4 والشكل 4.

مناقشة

تتناول قسم المناقشة في الورقة البحثية النتائج المستخلصة من دراسة طولية تستخدم بيانات من مجموعة حياة الشباب في إثيوبيا (YLCS)، التي تركز على فقر الأطفال والصحة. شملت الدراسة حوالي 1,999 طفلًا وامتدت على عدة سنوات، مع جمع البيانات عبر خمس مناطق إثيوبية. استخدمت التحليل شبكة LSTM-FC العصبية لتوقع سوء التغذية لدى الأطفال، مما يظهر تفوقها على النماذج التقليدية مثل ARIMA، غابة عشوائية (RF)، وغيرها في التقاط الاعتماديات الزمنية والأنماط المعقدة في البيانات. حقق نموذج LSTM-FC باستمرار مقاييس أداء أعلى، بما في ذلك الحساسية، النوعية، والدقة، مما يدل على فعاليته في توقع الحالة الغذائية عبر نقاط زمنية مختلفة.

تؤكد النتائج على استمرار مشكلة سوء التغذية في إثيوبيا، لا سيما خلال الأيام الألف الأولى الحرجة من حياة الطفل، والتي يمكن أن يكون لها آثار طويلة الأمد. على الرغم من الانخفاض في معدلات سوء التغذية لدى الأطفال دون سن الخامسة، تبرز الدراسة أن إثيوبيا لم تحقق أهداف التنمية الألفية، مما يبرز الحاجة إلى استمرار البحث والتدخل. تشير قدرة نموذج LSTM-FC على الاحتفاظ بالاعتماديات طويلة الأمد وأدائه القوي عبر آفاق التوقع المختلفة إلى أنه أداة قيمة لفهم ومعالجة تحديات التغذية لدى الأطفال في إثيوبيا وسياقات مماثلة.

القيود

في هذا القسم، يبرز المؤلفون كل من نقاط القوة والقيود في دراستهم حول نموذج LSTM-FC لتصنيف التغذية. يظهر النموذج أداءً متفوقًا مقارنة بالطرق الأساسية، محققًا دقة تصنيف عالية، وقابلية تعميم، وأخطاء توقع طفيفة عبر فئات غذائية مختلفة. تساهم عملية ضبط المعلمات الفائقة ومعالجة البيانات بشكل صارم في موثوقية النموذج. من الجدير بالذكر أن الدراسة تعالج بشكل فعال الظروف الغذائية المتزامنة لدى الأطفال، مما يوفر فهمًا دقيقًا لحالتهم الغذائية.

ومع ذلك، فإن أحد القيود الكبيرة هو غياب المقارنات مع النماذج الهجينة مثل LSTM-RF، LSTM-ARIMA، وLSTM-CNN، التي تم التعرف عليها في الأدبيات لقوتها التنبؤية. بالإضافة إلى ذلك، لم يتم تقييم النماذج المتقدمة المكانية الزمنية مثل T-GCN، القادرة على التقاط كل من الاعتماديات المكانية والزمنية. يقترح المؤلفون أن تشمل الأبحاث المستقبلية هذه النماذج لتعزيز الرؤى حول توقع السلاسل الزمنية والتحليل المكاني الزمني. علاوة على ذلك، يؤكدون على الحاجة إلى الوصول إلى أنظمة GPU عالية الأداء لتحسين ضبط المعلمات الفائقة لنموذج LSTM-FC وتقييم الأداء في الدراسات اللاحقة.

Journal: BioData Mining, Volume: 18, Issue: 1
DOI: https://doi.org/10.1186/s13040-025-00425-0
PMID: https://pubmed.ncbi.nlm.nih.gov/39885567
Publication Date: 2025-01-30
Author(s): Getnet Bogale Begashaw et al.
Primary Topic: Child Nutrition and Water Access

Overview

This study investigates the application of Long Short-Term Memory Fully Connected (LSTM-FC) neural networks to classify and predict the nutritional status of children in Ethiopia, addressing the pressing public health issue of undernutrition. Utilizing longitudinal data from the Young Lives cohort study, which tracked 1,997 children from 2002 to 2016, the research employs rigorous data preprocessing techniques, including normalization and feature selection via SHapley Additive exPlanations. The model’s performance was optimized through hyperparameter tuning, and results indicate that the LSTM-FC model significantly outperforms baseline models, achieving classification accuracy rates exceeding 93% and demonstrating strong generalization across various nutritional categories.

The findings reveal a troubling trend in child nutrition, with a decline in normal nutritional status among males from 58.3% at age 5 to 33.5% by age 25, alongside an increase in severe undernutrition conditions from 1.3% to 9.4%. The study highlights the LSTM-FC model’s effectiveness in accurately identifying nutritional statuses, particularly for normal and stunted-wasted categories, while also noting minimal prediction errors. These results underscore the urgent need for targeted public health interventions to combat the rising rates of undernutrition in Ethiopia, particularly in light of the country’s ongoing challenges related to healthcare access, food insecurity, and socio-political instability.

Introduction

The introduction of this research paper addresses the critical global health issue of child undernutrition, which is characterized by inadequate nutrient intake leading to stunted growth, weakened immune systems, and developmental delays. The World Health Organization (WHO) growth standards categorize undernutrition into three types: underweight, stunting, and wasting. Alarmingly, approximately 149 million children under five are stunted globally, with significant concentrations in Asia and Sub-Saharan Africa. Despite a slight decrease in stunting prevalence in Sub-Saharan Africa from 2012 to 2019, the rates remain unacceptably high, and undernutrition-related child mortality surpasses that from diarrhea and pneumonia combined.

The paper highlights the limitations of traditional statistical methods in analyzing child undernutrition, particularly their inability to manage long-term dependencies in sequential data. In contrast, Long Short-Term Memory (LSTM) networks, a specialized type of recurrent neural network (RNN), offer enhanced capabilities for capturing complex temporal patterns and improving predictions of children’s nutritional status. While LSTMs have been successfully applied in various health contexts, their use in assessing concurrent nutritional outcomes among children remains underexplored, particularly in Ethiopia. This study aims to evaluate the effectiveness of an LSTM-FC neural network against traditional models like Auto-Regressive Integrated Moving Average (ARIMA) and Random Forest (RF) in predicting undernutrition among children under 15, emphasizing the importance of understanding nutritional trends as children transition into adolescence. The paper is structured to present the background, methodology, results, and discussions, culminating in insights and recommendations for future research.

Methods

In this section, the performance of the LSTM-FC model is evaluated against various baseline methods for predicting child nutritional status across different developmental stages. The study highlights that neural network-based models, particularly LSTM-FC and Bi-LSTM, significantly outperform traditional models such as Random Forest (RF), Autoregressive Integrated Moving Average (ARIMA), Recurrent Neural Network (RNN), and Gated Recurrent Unit (GRU) in terms of predictive accuracy and precision. For instance, in the 2016 nutrition status forecasting task, the LSTM-FC and Bi-LSTM models achieved approximately 36% and 34% higher accuracy than the ARIMA model, with precision improvements of about 25% and 23%, respectively.

The LSTM-FC model demonstrated superior performance across various evaluation metrics—including accuracy, precision, recall, and F1-score—consistently achieving the highest values regardless of the prediction horizon. Specifically, it attained an overall accuracy of 93.4%, precision of 91.4%, recall of 89.8%, and F1-score of 90.2%, indicating its robustness and suitability for both short-term and long-term predictions. Detailed performance metrics for each model are available in the supplementary material, reinforcing the LSTM-FC model’s effectiveness in evaluating child nutritional status compared to its baseline counterparts.

Results

The results indicate notable variations in the nutritional status of children in Ethiopia across different age groups. During infancy (under 2 years), the prevalence of normal nutritional status is relatively high, with 19.37% of females and 18.32% of males classified as having a normal status. However, this percentage declines as children enter early adolescence (ages 12-14), dropping to 15.12% for females and 16.63% for males.

Conversely, the incidence of severe undernutrition, encompassing conditions such as underweight, stunting, and wasting, escalates with age. In particular, middle adolescence (ages 14-18) sees a significant increase in severe undernutrition among males, reaching 47.59%. Females, however, experience a more pronounced challenge earlier, with 52.34% affected during early adolescence. Detailed statistics are available in the supplementary material, specifically in Table S4 and Figure 4.

Discussion

The discussion section of the research paper elaborates on the findings from a longitudinal study utilizing data from Ethiopia’s Young Lives of Young cohort (YLCS), which focuses on childhood poverty and health. The study involved approximately 1,999 children and spanned multiple years, with data collected across five Ethiopian regions. The analysis employed an LSTM-FC neural network to predict child undernutrition, demonstrating its superiority over traditional models such as ARIMA, Random Forest (RF), and others in capturing temporal dependencies and complex patterns in the data. The LSTM-FC model consistently achieved higher performance metrics, including sensitivity, specificity, and accuracy, indicating its effectiveness in predicting nutritional status across various time points.

The results underscore the persistent issue of undernutrition in Ethiopia, particularly during the critical first 1,000 days of a child’s life, which can have long-lasting effects. Despite a decline in under-five undernutrition rates, the study highlights that Ethiopia has not met the Millennium Development Goals, emphasizing the need for continued research and intervention. The LSTM-FC model’s ability to retain long-term dependencies and its robust performance across different predictive horizons suggest it is a valuable tool for understanding and addressing child nutritional challenges in Ethiopia and similar contexts.

Limitations

In this section, the authors highlight both the strengths and limitations of their study on the LSTM-FC model for nutritional classification. The model demonstrates superior performance compared to baseline methods, achieving high classification accuracy, generalizability, and minimal prediction error across various nutritional categories. Rigorous hyperparameter tuning and data preprocessing contribute to the model’s reliability. Notably, the study effectively addresses concurrent nutritional conditions in children, offering a nuanced understanding of their nutritional status.

However, a significant limitation is the absence of comparisons with hybrid models such as LSTM-RF, LSTM-ARIMA, and LSTM-CNN, which are recognized in the literature for their predictive strengths. Additionally, advanced spatio-temporal models like T-GCN, capable of capturing both spatial and temporal dependencies, were not evaluated. The authors suggest that future research should incorporate these models to enhance insights into time-series prediction and spatio-temporal analysis. Furthermore, they emphasize the need for access to high-performance GPU systems to optimize the LSTM-FC model’s hyperparameter tuning and performance evaluation in subsequent studies.