توقع توليد النفايات وإمكانات الانبعاثات في مكبات النفايات الصلبة في مدينة إيرود بناءً على نهج التعلم الآلي
Prediction of waste generation forecast and emission potential on the Erode City solid waste dump yards based on machine learning approach

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-19288-w
PMID: https://pubmed.ncbi.nlm.nih.gov/41131036
تاريخ النشر: 2025-10-23
المؤلف: E. B. Priyanka وآخرون
الموضوع الرئيسي: إدارة النفايات الصلبة البلدية

نظرة عامة

تقدم البحث المقترح إطار عمل قائم على البيانات لتوقع توليد النفايات الصلبة البلدية (MSW) والانبعاثات في مدينة إيرود، الهند، باستخدام خوارزميات التعلم الآلي الخاضعة للإشراف. تستخدم الدراسة مجموعة بيانات لمدة خمس سنوات (2019-2024) تشمل المتغيرات الاجتماعية والاقتصادية، وأنماط النفايات المناطقية، وحجوم النفايات التاريخية. الخوارزميات الرئيسية المستخدمة في التحليل هي آلة الدعم الشعاعي (SVM)، وغابة عشوائية (RF)، وبايز الساذج (NB). من خلال تقنيات اختيار الميزات وترتيب القرب، تحدد الدراسة النفايات البلاستيكية والعضوية كأهم المؤشرات لتوليد النفايات. تم إجراء خطوات معالجة البيانات مثل التطبيع، وإدخال القيم المفقودة، وتحليل تقسيم المناطق، وتم التحقق من صحة النموذج باستخدام نسبة تدريب إلى اختبار 80:20.

تشير النتائج إلى أن نموذج SVM تفوق على الآخرين، محققًا دقة توقع تبلغ 96% وأدنى خطأ متوسط مربعات (MSE = 4860)، مع زمن معالجة قدره 0.67 ثانية، مما يجعله مناسبًا للتطبيقات في الوقت الحقيقي. بالمقابل، حققت نماذج RF وNB دقة قدرها 91.5% و93.2% على التوالي، ولكن مع هوامش خطأ أعلى. كما كشفت التحليلات عن زيادة كبيرة في حجم النفايات من 2566.65 طن/يوم إلى 3724.18 طن/يوم خلال فترة الدراسة، مما يبرز الحاجة الملحة للتدخلات المنهجية في إدارة النفايات. يسهل دمج التعلم الآلي مع المؤشرات الاجتماعية والاقتصادية والمكانية التخطيط الإقليمي الفعال وتوقع الانبعاثات، مما يدعم استراتيجيات إدارة النفايات القائمة على البيانات ويعزز اعتماد الذكاء الاصطناعي من أجل الاستدامة البيئية على المدى الطويل. ستستكشف الأبحاث المستقبلية دمج بيانات المستشعرات في الوقت الحقيقي وهياكل التعلم العميق الهجينة لتعزيز جهود التعامل مع النفايات وتخفيف الكربون بشكل أكبر.

الطرق

تستخدم المنهجية المقترحة في هذه الدراسة إطارًا تجريبيًا شاملاً يهدف إلى تحسين أنظمة إدارة النفايات الصلبة البلدية (MSWM) من خلال الحصول على بيانات في الوقت الحقيقي، وتصنيف النفايات، ونماذج تصنيف التعلم الآلي. تضمنت المرحلة الأولية مسحًا تفصيليًا لمكبات النفايات الحضرية، حيث تم مراقبة توليد النفايات وممارسات التخلص منها. ركز جمع البيانات على حجم ونوع ومصدر المواد النفايات، باستخدام تحديد المواقع الجغرافية للتوزيع المكاني وتوقيت التحليل الزمني. تم رقمنة مجموعات البيانات التاريخية حول تركيب النفايات وإدارتها البلدية وتزامنها مع البيانات في الوقت الحقيقي، مما يضمن تحليلًا طوليًا متماسكًا. تم استخدام نهج أخذ عينات عنقودية متعددة المراحل لالتقاط شرائح اجتماعية واقتصادية وجغرافية متنوعة، مع إجراء مقابلات مع أصحاب المصلحة لإثراء البيانات.

تحدد الدراسة العوامل الاجتماعية والاقتصادية مثل كثافة السكان، ودخل الأسر، ومعدل التحضر، ومستوى التعليم، ومعدل التوظيف، ونفقات الطعام للفرد كمؤشرات رئيسية لتوليد النفايات الصلبة. تم توزيع الاستبيانات عبر إعدادات حضرية مختلفة، وتم تسهيل جمع النفايات من خلال شبكة من صناديق النفايات والشاحنات. تم معالجة البيانات الاجتماعية والاقتصادية التاريخية التي تمتد لخمس سنوات (2019-2023) ودمجها مع إحصائيات إنتاج النفايات لتدريب النماذج التنبؤية. تم التأكيد على موثوقية البيانات الاجتماعية والاقتصادية كأمر حاسم لتوقعات النفايات الدقيقة، مع استخدام مصادر موثوقة فقط. تشير النتائج إلى أن تحسين بنية جمع النفايات يمكن أن يخفف من تحديات التخلص، حيث تكشف الممارسات الحالية عن عدم كفاية الوصول إلى خدمات جمع النفايات من الباب إلى الباب، خاصة في بعض المناطق الحضرية. تسلط التحليلات الضوء على نقص الوعي العام بشأن تقنيات التخلص من النفايات بين السكان، والذي يختلف بشكل كبير عبر مجموعات اجتماعية واقتصادية مختلفة.

النتائج

تسلط نتائج هذه الدراسة الضوء على تعقيد توقع توليد النفايات الصلبة (SW) والانبعاثات، مما يبرز الحاجة إلى مراعاة عوامل اجتماعية واقتصادية متنوعة. تستخدم البحث تقنيات متقدمة في التعلم الآلي، بما في ذلك الغابة العشوائية، وآلة الدعم الشعاعي، وبايز الساذج، لتوقع معدلات توليد النفايات الصلبة. تم إجراء معالجة البيانات باستخدام برنامج إحصائيات البيانات 4.3 لضمان مجموعات بيانات عالية الجودة، مع التركيز على أحجام النفايات الدقيقة، مستثنيًا القمامة والطين. تتناول الدراسة فجوات البيانات من خلال طرق التسوية، مستبدلة الانحرافات المعيارية بالسجلات التاريخية عند الضرورة، وتدمج إجمالي النفايات التي تم التخلص منها والمعاد تدويرها في حساباتها.

تشير النتائج الرئيسية إلى أن حجم الأسرة، ومستوى الدخل، والتحصيل العلمي هي العوامل الأكثر أهمية التي تؤثر على توليد النفايات. ومع ذلك، تشير الدراسة إلى نقص السجلات التاريخية الرسمية في الدول الناشئة، مما يعقد توقع إنتاج النفايات الصلبة البلدية (MSW). تكشف التحليلات أن العلاقات بين هذه الخصائص الاجتماعية والاقتصادية تختلف، مما يشير إلى أن التوقعات على مستوى واحد قد لا تنطبق بشكل عام. تنوع النماذج الحالية، التي تتراوح من مستوى المقاطعة إلى مستوى الأسرة، يبرز أهمية اختيار مجاري النفايات المناسبة للنمذجة الفعالة. بشكل عام، تستنتج الدراسة أن الكميات الإجمالية من النفايات، بما في ذلك القمامة والطين، في تزايد، مما يتطلب تقنيات معالجة البيانات والنمذجة الدقيقة لتعزيز دقة التوقعات.

المناقشة

تسلط المناقشة الضوء على الزيادة المقلقة العالمية في توليد النفايات الصلبة (SW)، والتي من المتوقع أن ترتفع بنسبة 70% بحلول عام 2050، مع مساهمة البلدان ذات الدخل المرتفع بشكل غير متناسب في هذه المشكلة. في عام 2016، تم إنتاج أكثر من 2 مليار طن متري من النفايات، مع توقعات تشير إلى 3.4 مليار طن بحلول عام 2050. تكشف التحليلات عن علاقة قوية بين مستويات الدخل وتوليد النفايات، حيث تنتج الدول ذات الدخل المرتفع 34% من نفايات العالم على الرغم من كونها تشكل فقط 16% من سكان العالم. علاوة على ذلك، فإن الآثار البيئية للإدارة غير الكافية للنفايات، وخاصة من المكبات المفتوحة، كبيرة، مما يساهم في انبعاثات غازات الدفيئة وتلوث الهواء ومصادر المياه.

لمعالجة هذه التحديات، يتم اقتراح دمج الذكاء الاصطناعي (AI) والتعلم الآلي (ML) في أنظمة إدارة النفايات الصلبة البلدية (MSWM). لقد أظهرت تقنيات الذكاء الاصطناعي، مثل آلات الدعم الشعاعي (SVM) والغابات العشوائية (RF)، وعدًا في توقع توليد النفايات بدقة وتحسين طرق الجمع. يعزز تطبيق المستشعرات المدعومة بالإنترنت للأشياء (IoT) ونماذج التعلم العميق فرز النفايات واستردادها في الوقت الحقيقي، مما يحسن الكفاءة التشغيلية ويقلل التكاليف. تؤكد الدراسة على الحاجة إلى أطر جمع بيانات قوية وشراكات بين القطاعين العام والخاص لدعم استراتيجيات إدارة النفايات الفعالة، خاصة في المناطق النامية مثل مدينة إيرود، الهند. من خلال الاستفادة من الذكاء الاصطناعي والتعلم الآلي، يمكن للبلديات التنبؤ بشكل أفضل بديناميات النفايات، وتقييم الآثار البيئية، وتنفيذ ممارسات إدارة النفايات المستدامة.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-19288-w
PMID: https://pubmed.ncbi.nlm.nih.gov/41131036
Publication Date: 2025-10-23
Author(s): E. B. Priyanka et al.
Primary Topic: Municipal Solid Waste Management

Overview

The proposed research introduces a data-driven framework for forecasting municipal solid waste (MSW) generation and emissions in Erode City, India, utilizing supervised machine learning algorithms. The study employs a five-year dataset (2019-2024) that includes socio-economic variables, zonal waste typologies, and historical waste volumes. Key algorithms used in the analysis are Support Vector Machine (SVM), Random Forest (RF), and Naive Bayes (NB). Through feature selection and proximity ranking techniques, the research identifies plastic and organic waste as the most significant predictors of waste generation. Data pre-processing steps such as normalization, missing value imputation, and spatial zoning analysis were conducted, and the model was validated using an 80:20 training-to-testing ratio.

The findings indicate that the SVM model outperformed the others, achieving a prediction accuracy of 96% and the lowest mean squared error (MSE = 4860), with a processing latency of 0.67 seconds, making it suitable for real-time applications. In contrast, the RF and NB models achieved accuracies of 91.5% and 93.2%, respectively, but with higher error margins. The analysis also revealed a significant increase in waste volume from 2566.65 MT/day to 3724.18 MT/day over the study period, highlighting the urgent need for systematic waste management interventions. The integration of machine learning with socio-economic and spatial indicators facilitates efficient zonal planning and emission forecasting, supporting data-driven waste management strategies and promoting the adoption of AI for long-term environmental sustainability. Future research will explore the incorporation of real-time sensor data and hybrid deep learning architectures to further enhance waste handling and carbon mitigation efforts.

Methods

The proposed methodology in this study employs a comprehensive experimental framework aimed at optimizing municipal solid waste management (MSWM) systems through real-time data acquisition, waste characterization, and machine learning classification models. The initial phase involved a detailed survey of urban dump yards, where waste generation and disposal practices were monitored. Data collection focused on the volume, type, and source of waste materials, utilizing geo-tagging for spatial distribution and time-stamping for temporal analysis. Historical datasets on waste composition and municipal handling were digitized and synchronized with real-time data, ensuring a coherent longitudinal analysis. A multi-stage cluster sampling approach was employed to capture diverse socio-economic and geographical segments, with stakeholder interviews conducted to enrich the data.

The study identifies socio-economic factors such as population density, household income, urbanization rate, education level, employment rate, and per capita food expenditure as key predictors of solid waste generation. Surveys were distributed across various urban settings, and waste collection was facilitated through a network of dumper bins and collection trucks. Historical socio-economic data spanning five years (2019-2023) were pre-processed and integrated with waste production statistics to train predictive models. The reliability of the socio-economic data was emphasized as crucial for accurate waste predictions, with only validated sources utilized. The findings indicate that improving waste collection infrastructure could alleviate disposal challenges, as current practices reveal inadequate access to door-to-door collection services, particularly in certain urban zones. The analysis highlights a general lack of awareness regarding waste disposal techniques among residents, which varies significantly across different socio-economic groups.

Results

The results of this study highlight the complexity of forecasting solid waste (SW) generation and emissions, emphasizing the need to consider various socioeconomic factors. The research employs advanced machine learning techniques, including Random Forest, Support Vector Machine, and Naive Bayes, to predict SW generation rates. Data preprocessing was conducted using the Data Statistics program 4.3 to ensure high-quality datasets, with a focus on accurate waste volumes, excluding garbage and silt. The study addresses data gaps through reconciliation methods, substituting standard deviations for historical records when necessary, and incorporates total waste disposed of and recycled in its calculations.

Key findings indicate that household size, income level, and educational attainment are the most significant factors influencing waste generation. However, the study notes a lack of official historical records in emerging nations, which complicates the prediction of municipal solid waste (MSW) production. The analysis reveals that correlations among these socioeconomic traits vary, suggesting that predictions at one level may not apply universally. The diversity of existing models, which range from county to household levels, underscores the importance of selecting appropriate waste streams for effective modeling. Overall, the study concludes that the total quantities of waste, including garbage and silt, are on the rise, necessitating precise data handling and modeling techniques to enhance forecasting accuracy.

Discussion

The discussion highlights the alarming global increase in solid waste (SW) generation, projected to rise by 70% by 2050, with high-income countries disproportionately contributing to this issue. In 2016, over 2 billion metric tons of waste were produced, with predictions estimating 3.4 billion tons by 2050. The analysis reveals a strong correlation between income levels and waste generation, with high-income nations producing 34% of the world’s waste despite constituting only 16% of the global population. Furthermore, the environmental impacts of inadequate waste management, particularly from open dumps, are significant, contributing to greenhouse gas emissions and pollution of air and water resources.

To address these challenges, the integration of artificial intelligence (AI) and machine learning (ML) into municipal solid waste management (MSWM) systems is proposed. AI techniques, such as Support Vector Machines (SVM) and Random Forests (RF), have shown promise in accurately forecasting waste generation and optimizing collection routes. The application of IoT-enabled sensors and deep learning models enhances real-time waste sorting and recovery, improving operational efficiency and reducing costs. The study emphasizes the need for robust data collection frameworks and public-private partnerships to support effective waste management strategies, particularly in developing regions like Erode City, India. By leveraging AI and ML, municipalities can better predict waste dynamics, assess environmental impacts, and implement sustainable waste management practices.