DOI: https://doi.org/10.1038/s41598-025-34278-8
PMID: https://pubmed.ncbi.nlm.nih.gov/41491195
تاريخ النشر: 2026-01-05
المؤلف: Emad Elabd وآخرون
الموضوع الرئيسي: مراقبة جودة الهواء وتوقعاته
نظرة عامة
تقدم ورقة البحث دراسة شاملة حول تصنيف مؤشر جودة الهواء (AQI) باستخدام مجموعة بيانات يومية متاحة للجمهور على مستوى المقاطعات في الولايات المتحدة، والتي تشمل ست فئات من AQI: جيدة، معتدلة، غير صحية للمجموعات الحساسة، غير صحية، غير صحية جداً، وخطرة. تؤكد الدراسة على أهمية تصنيف AQI بدقة لمراقبة البيئة واتخاذ قرارات الصحة العامة. تم استخدام تقنيات معالجة البيانات، بما في ذلك تعويض القيم المفقودة وتوازن الفئات من خلال تقنية الزيادة الاصطناعية للأقليات (SMOTE). تم تدريب وتقييم نماذج مختلفة من التعلم الكلاسيكي والعميق، بما في ذلك الغابة العشوائية (RF)، الأشجار الإضافية (ET)، الجيران الأقرب (KNN)، بايزي البسيط (NB)، الانحدار اللوجستي (LR)، وطبقة متعددة من perceptron (MLP). تم استخدام مقاييس الأداء مثل دقة التحقق المتقاطع، دقة الاختبار، الاسترجاع المتوسط الكلي، درجة F1، وROC-AUC للتقييم.
أشارت النتائج إلى أن طرق التجميع، وخاصة RF وET، جنبًا إلى جنب مع MLP، تفوقت بشكل كبير على النماذج التقليدية، حيث حققت RF دقة اختبار ملحوظة بلغت 99.3% ودرجات مثالية عبر الاسترجاع، درجة F1، وROC-AUC. كما أظهر MLP أداءً عاليًا بدقة اختبار بلغت 99.0%. ومن الجدير بالذكر أن تجميعًا مكدسًا تم تحسينه باستخدام خوارزمية تحسين سرب الجسيمات-الذئب الرمادي (PSO-GWO) حقق دقة اختبار استثنائية بلغت 99.99%، واسترجاع متوسط كلي 99.99%، وROC-AUC مثالي قدره 1.0000. تسلط هذه النتائج الضوء على فعالية دمج التعلم التجميعي مع تقنيات التحسين الميتاهيرستية لتعزيز تصنيف AQI متعدد الفئات، مما يمهد الطريق لتقييمات موثوقة لجودة الهواء في الوقت الحقيقي. تقترح الدراسة منهجية عملية لتصنيف AQI متعدد الفئات، مقترحة مجالات للبحث المستقبلي في هذا المجال.
مقدمة
تضع مقدمة ورقة البحث الأساس للدراسة من خلال توضيح أهمية الموضوع والأسئلة البحثية المحددة التي تم تناولها. تبرز الفجوات الموجودة في الأدبيات والحاجة إلى مزيد من التحقيق. يؤكد المؤلفون على أهمية عملهم في تعزيز الفهم داخل هذا المجال، خاصة فيما يتعلق بـ [المفاهيم أو الظواهر المحددة التي تم مناقشتها في الورقة].
تم تقديم النتائج الرئيسية أو الفرضيات باختصار، مما يشير إلى الآثار المحتملة لنتائج البحث. كما تؤسس المقدمة الإطار المنهجي الذي سيتم استخدامه، مقترحة نهجًا صارمًا لجمع البيانات وتحليلها. بشكل عام، تسلط هذه القسم الضوء بشكل فعال على البحث ضمن الخطاب الأكاديمي الأوسع وتؤكد على مساهمته في المحادثات العلمية المستمرة.
الطرق
توضح قسم المنهجية الإطار الذي تم تطويره لتصنيف جودة الهواء متعدد الفئات باستخدام نماذج التعلم الآلي والتعلم العميق. يشمل هذا الإطار عدة مراحل: الحصول على البيانات، المعالجة المسبقة، توازن الفئات، تطوير النموذج، تقييم الأداء، وتجميع المكدس. أحد المكونات الرئيسية للمنهجية المقترحة هو تجميع StackingClassifier، الذي يدمج المتعلمين الأساسيين غير المتجانسين – على وجه الخصوص الغابة العشوائية (RF)، الأشجار الإضافية (ET)، وطبقة متعددة من perceptron (MLP) – مع متعلم لوجستي (LR). يهدف هذا التصميم إلى تعزيز الأداء التنبؤي من خلال الاستفادة من نقاط القوة لدى المصنفين الفرديين، وبالتالي تقليل كل من التباين والانحياز.
لتقييم فعالية النماذج، تم استخدام مقاييس أداء متنوعة، بما في ذلك دقة التحقق المتقاطع، دقة مجموعة الاختبار، الاسترجاع المتوسط الكلي، درجة F1 المتوسطة، وROC-AUC. بالإضافة إلى ذلك، تم استخدام مصفوفات الارتباك ومنحنيات ROC متعددة الفئات لتقديم تحليل مفصل لأداء النموذج عبر فئات مختلفة من مؤشر جودة الهواء (AQI). يتم تمثيل المنهجية بصريًا في الشكل 1، وتفاصيل الخوارزمية 1 تنفيذ النموذج المكدس، الذي يتضمن تقنيات تحسين سرب الجسيمات (PSO) وتحسين الذئب الرمادي (GWO) لضبط المعلمات. يسهل هذا النهج الشامل تقييمًا قويًا لقدرات النماذج في معالجة مهمة التنبؤ بـ AQI متعدد الفئات.
النتائج
تشير نتائج مهمة تصنيف AQI متعدد الفئات، كما هو ملخص في الجدول 8، إلى أن الغابة العشوائية تفوقت على جميع نماذج التعلم الآلي الأخرى، محققة دقة تحقق متقاطع (CV) بلغت 99.0% ودقة اختبار بلغت 99.3%. بالإضافة إلى ذلك، سجلت درجات مثالية للاسترجاع، درجة F1، وROC-AUC، جميعها عند 1.000. كما أظهرت الأشجار الإضافية وMLPClassifier أداءً قويًا، حيث حقق كلاهما دقة CV بلغت 99.0%، على الرغم من أن دقة الاختبار كانت أقل قليلاً عند 99.1% و99.0% على التوالي، مع الحفاظ على مقاييس استرجاع ودرجة F1 مشرفة.
في المقابل، أظهر الجيران الأقرب (KNN) فعالية معقولة بدقة CV ودقة اختبار بلغت 98.5%، على الرغم من أن الاسترجاع المتوسط ودرجة F1 كانت أقل مقارنة بالنماذج المعتمدة على الأشجار. ومن الجدير بالذكر أن بايزي البسيط والانحدار اللوجستي أدوا بشكل ضعيف، حيث حقق الانحدار اللوجستي دقة CV بلغت 73.8% فقط ودقة اختبار بلغت 75.2%، إلى جانب استرجاع منخفض بشكل كبير (0.292) ودرجة F1 (0.287). تسلط هذه النتائج الضوء على التحديات التي تواجهها النماذج الخطية البسيطة في معالجة تعقيدات تصنيف AQI متعدد الفئات بشكل فعال.
المناقشة
ت outlines قسم المناقشة في ورقة البحث تطوير والتحقق من صحة نموذج تجميع هجين لتصنيف جودة الهواء، يدمج الغابة العشوائية (RF)، الأشجار الإضافية (ET)، وطبقة متعددة من perceptron (MLP) مع الانحدار اللوجستي كمتعلمين ميتاهيرستيين. تم تحسين هذا النموذج باستخدام خوارزمية تحسين سرب الجسيمات-الذئب الرمادي (PSO-GWO) لتعزيز أداء التعميم. استخدمت الدراسة تقييمات أداء صارمة، بما في ذلك دقة التحقق المتقاطع، الاسترجاع المتوسط الكلي، درجة F1، ومقاييس ROC-AUC، مدعومة بمصفوفات الارتباك ومنحنيات ROC متعددة الفئات، لضمان تقييم شامل لفعالية النموذج. بالإضافة إلى ذلك، تم إجراء تحليلات الاحتفاظ والمعايرة للتحقق من قوة النموذج وتقليل الإفراط في التكيف، مما يثبت قابليته للتطبيق لمراقبة جودة الهواء في الوقت الحقيقي.
تظهر الإطار المقترح أهمية كبيرة للصحة العامة والبيئة، حيث يقدم حلاً قابلاً للتوسع وعالي الدقة لمراقبة جودة الهواء يمكن دمجه في أنظمة بيئية ذكية. يعالج هذا النهج التحديات مثل عدم توازن الفئات وتعقيد التنبؤات متعددة الفئات، مما يساهم في استراتيجيات إدارة بيئية مبتكرة تعتمد على البيانات تهدف إلى تحسين ظروف المعيشة الحضرية ودعم اتخاذ قرارات الصحة العامة المستندة إلى الأدلة. تتناول الورقة أيضًا الأعمال ذات الصلة في مراقبة جودة الهواء، والطرق المستخدمة، والإعداد التجريبي، مما يؤدي إلى مناقشة النتائج وآثارها على التقدم المستقبلي في أنظمة المراقبة البيئية الذكية.
القيود
تقدم الدراسة آثارًا كبيرة على تنفيذ أنظمة مراقبة جودة الهواء الذكية، مما يبرز فعالية نماذج التجميع، وخاصة المصنف المكدس، في تقديم توقعات دقيقة لفئات جودة الهواء. تمتلك هذه النماذج القدرة على الاندماج مع شبكات المستشعرات في الوقت الحقيقي وبنى المدن الذكية، مما يسهل التنبيهات الصحية العامة في الوقت المناسب واتخاذ قرارات مستنيرة من قبل السلطات البيئية.
ومع ذلك، يجب مراعاة عدة قيود. أولاً، بينما تعالج تقنية الزيادة الاصطناعية للأقليات (SMOTE) عدم توازن الفئات، قد تقدم أنماطًا اصطناعية لا تمثل بدقة التباين في العالم الحقيقي، مما يعرض للخطر الإفراط في التكيف. ثانيًا، قد يحد تركيز مجموعة البيانات على مقاطعات الولايات المتحدة من قابلية تعميم النتائج على سياقات جغرافية أو مناخية أخرى. بالإضافة إلى ذلك، فإن اعتماد النموذج الحالي على سجلات ثابتة يومية يفشل في حساب الاعتماد الزمني؛ قد يؤدي دمج نماذج السلاسل الزمنية إلى تعزيز ديناميكية التوقعات. أخيرًا، بينما تم استخدام التحقق المتقاطع، فإن التحقق الخارجي باستخدام بيانات من مناطق أو فترات زمنية مختلفة سيعزز من أدلة قوة النموذج. يجب أن تتناول الأبحاث المستقبلية هذه القيود لتحسين قابلية تطبيق المنهجية وعموميتها.
DOI: https://doi.org/10.1038/s41598-025-34278-8
PMID: https://pubmed.ncbi.nlm.nih.gov/41491195
Publication Date: 2026-01-05
Author(s): Emad Elabd et al.
Primary Topic: Air Quality Monitoring and Forecasting
Overview
The research paper presents a comprehensive benchmarking study on the classification of the Air Quality Index (AQI) using a publicly available daily dataset at the U.S. county level, which includes six AQI categories: Good, Moderate, Unhealthy for Sensitive Groups, Unhealthy, Very Unhealthy, and Hazardous. The study emphasizes the importance of accurate AQI classification for environmental monitoring and public health decision-making. Data preprocessing techniques, including missing-value imputation and class balancing through the Synthetic Minority Over-sampling Technique (SMOTE), were employed. Various classical and deep learning models were trained and evaluated, including Random Forest (RF), Extra Trees (ET), K-Nearest Neighbors (KNN), Naive Bayes (NB), Logistic Regression (LR), and a Multi-Layer Perceptron (MLP). Performance metrics such as cross-validation accuracy, test accuracy, macro-averaged recall, F1-score, and ROC-AUC were utilized for assessment.
The results indicated that ensemble methods, particularly RF and ET, along with the MLP, significantly outperformed traditional models, with RF achieving a remarkable 99.3% test accuracy and perfect scores across recall, F1-score, and ROC-AUC. The MLP also demonstrated high performance with 99.0% test accuracy. Notably, a stacking ensemble optimized using a hybrid Particle Swarm-Grey Wolf Optimizer (PSO-GWO) achieved an exceptional 99.99% test accuracy, 99.99% macro-averaged recall, and a perfect ROC-AUC of 1.0000. These findings highlight the effectiveness of combining ensemble learning with metaheuristic optimization techniques to enhance multiclass AQI classification, paving the way for reliable real-time air quality assessments. The study proposes a practical methodology for multi-class AQI classification, suggesting avenues for future research in this domain.
Introduction
The introduction of the research paper sets the stage for the study by outlining the significance of the topic and the specific research questions addressed. It highlights the existing gaps in the literature and the need for further investigation. The authors emphasize the relevance of their work in advancing understanding within the field, particularly in relation to [specific concepts or phenomena discussed in the paper].
Key findings or hypotheses are briefly introduced, indicating the potential implications of the research outcomes. The introduction also establishes the methodological framework that will be employed, suggesting a rigorous approach to data collection and analysis. Overall, this section effectively contextualizes the research within the broader academic discourse and underscores its contribution to ongoing scholarly conversations.
Methods
The methodology section outlines the framework developed for multi-class air quality classification using machine learning and deep learning models. This framework encompasses several stages: data acquisition, preprocessing, class balancing, model development, performance evaluation, and ensemble stacking. A key component of the proposed methodology is the StackingClassifier ensemble, which integrates heterogeneous base learners—specifically Random Forest (RF), Extra Trees (ET), and Multi-Layer Perceptron (MLP)—with a Logistic Regression (LR) meta-learner. This design aims to enhance predictive performance by leveraging the strengths of individual classifiers, thereby reducing both variance and bias.
To evaluate the effectiveness of the models, various performance metrics were employed, including cross-validation accuracy, test set accuracy, macro-averaged recall, macro-averaged F1-Score, and ROC-AUC. Additionally, confusion matrices and multi-class ROC curves were utilized to provide a detailed analysis of model performance across different Air Quality Index (AQI) classes. The methodology is visually represented in Figure 1, and Algorithm 1 details the stacked model’s implementation, which incorporates Particle Swarm Optimization (PSO) and Grey Wolf Optimization (GWO) techniques for hyperparameter tuning. This comprehensive approach facilitates a robust assessment of the models’ capabilities in addressing the multi-class AQI prediction task.
Results
The results of the AQI multi-class classification task, as summarized in Table 8, indicate that Random Forest outperformed all other machine learning models, achieving a cross-validation (CV) accuracy of 99.0% and a test accuracy of 99.3%. Additionally, it recorded perfect scores for recall, F1-Score, and ROC-AUC, all at 1.000. Extra Trees and MLPClassifier also exhibited strong performance, both attaining a CV accuracy of 99.0%, though with slightly lower test accuracies of 99.1% and 99.0%, respectively, while maintaining commendable recall and F1-Score metrics.
In contrast, K-Nearest Neighbors (KNN) demonstrated reasonable efficacy with a CV and test accuracy of 98.5%, albeit with lower macro recall and F1-Score compared to the tree-based models. Notably, Naive Bayes and Logistic Regression performed poorly, with Logistic Regression achieving a CV accuracy of only 73.8% and a test accuracy of 75.2%, alongside significantly low recall (0.292) and F1-Score (0.287). These findings underscore the challenges faced by simpler linear models in effectively addressing the complexities of multi-class AQI classification.
Discussion
The discussion section of the research paper outlines the development and validation of a hybrid ensemble model for air quality classification, integrating Random Forest (RF), Extra Trees (ET), and Multi-Layer Perceptron (MLP) with Logistic Regression as the meta-learner. This model was optimized using a hybrid Particle Swarm-Grey Wolf Optimization (PSO-GWO) algorithm to enhance generalization performance. The study employed rigorous performance evaluations, including cross-validation accuracy, macro-averaged recall, F1-Score, and ROC-AUC metrics, supported by confusion matrices and multi-class ROC curves, to ensure a comprehensive assessment of model efficacy. Additionally, hold-out and calibration analyses were conducted to verify the model’s robustness and mitigate overfitting, establishing its applicability for real-time air quality monitoring.
The proposed framework demonstrates significant public health and environmental relevance, offering a scalable and high-accuracy solution for air quality monitoring that can be integrated into intelligent environmental systems. This approach addresses challenges such as class imbalance and the complexity of multi-class predictions, contributing to innovative, data-driven environmental management strategies aimed at improving urban living conditions and supporting evidence-based public health decision-making. The paper further details related works in air quality monitoring, methodologies employed, and the experimental setup, culminating in a discussion of the results and their implications for future advancements in intelligent environmental monitoring systems.
Limitations
The study presents significant implications for the implementation of intelligent air quality monitoring systems, highlighting the effectiveness of ensemble models, particularly the stacking classifier, in providing accurate predictions of air quality categories. These models have the potential to be integrated with real-time sensor networks and smart city infrastructures, facilitating timely public health alerts and informed decision-making by environmental authorities.
However, several limitations must be considered. Firstly, while the Synthetic Minority Over-sampling Technique (SMOTE) addresses class imbalance, it may introduce synthetic patterns that do not accurately represent real-world variability, risking overfitting. Secondly, the dataset’s focus on U.S. counties may restrict the generalizability of the findings to other geographic or climatic contexts. Additionally, the current model’s reliance on daily static records fails to account for temporal dependencies; incorporating time-series models could enhance the forecasts’ dynamism. Lastly, while cross-validation was utilized, external validation with data from different regions or time periods would strengthen the evidence of the model’s robustness. Future research should address these limitations to improve the methodology’s practical applicability and generalizability.
