تطوير نموذج هجين قائم على التعلم الآلي مع تعديل موسمي للتنبؤ بتحذير موجات الحرارة
Developing a seasonal-adjusted machine-learning-based hybrid time‑series model to forecast heatwave warning

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-93227-7
PMID: https://pubmed.ncbi.nlm.nih.gov/40082574
تاريخ النشر: 2025-03-13
المؤلف: M. Qureshi وآخرون
الموضوع الرئيسي: تقنيات التنبؤ وتطبيقاتها

نظرة عامة

تناقش هذه الفقرة التأثير الحاسم لموجات الحرارة على الاستدامة البيئية والصحة العامة، خاصة في المناطق الضعيفة والمناطق التي تشهد حضرًا سريعًا. تؤدي موجات الحرارة إلى نقص المياه، وضغط على النباتات، وتراجع في نمو النباتات، وهو أمر أساسي لإنتاج الطاقة وسلسلة الغذاء. إن التنبؤ الفعال بموجات الحرارة أمر حيوي لأنظمة الإنذار المبكر وتدخلات الصحة العامة، حيث يمكن أن يقلل بشكل كبير من مخاطر الوفيات المرتبطة بالحرارة. تتناول الدراسة التحديات المرتبطة بالتنبؤ ببيانات السلاسل الزمنية اليومية عالية التردد من خلال اقتراح نموذجين هجينين قائمين على التعلم الآلي (ML)، بما في ذلك التعديلات الموسمية.

تم تقييم أداء هذه النماذج مقابل طرق السلاسل الزمنية التقليدية مثل المتوسط المتحرك الذاتي المتكامل (ARIMA)، وتنعيم الأسطح المتسلسلة (ETS)، ونموذج الاتجاه الموسمي Trigonometric Box-Cox ARMA (TBATS)، بالإضافة إلى نماذج التعلم الآلي الأخرى مثل الشبكة العصبية الاصطناعية (ANN)، والانحدار باستخدام دعم المتجهات (SVR)، وProphet، والانحدار باستخدام الغابة العشوائية (RFR)، وذاكرة طويلة وقصيرة الأجل (LSTM). أظهرت النتائج أن النموذج الهجين القائم على التعلم الآلي المعدل موسميًا، وبالتحديد STL-ARIMA-LSTM، حقق دقة تنبؤ متفوقة مع مقاييس تشمل متوسط الخطأ المطلق (MAE) بمقدار 0.8974، ومتوسط الخطأ النسبي المطلق (MAPE) بمقدار 2.9232، وجذر متوسط مربع الخطأ (RMSE) بمقدار 1.1794، ومتوسط الخطأ المطلق المقاس (MASE) بمقدار 0.3814، ودالة الارتباط الذاتي عند التأخير 1 (ACF1) بمقدار 0.0026. يعزز هذا النموذج دقة توقعات موجات الحرارة، مما يسمح بتحسين التخطيط وتدابير السلامة في انتظار أحداث موجات الحرارة.

طرق

تحدد فقرة “المواد والطرق” تصميم التجربة والإجراءات المستخدمة في الدراسة. توضح المواد المحددة المستخدمة، بما في ذلك أي مواد كيميائية، ومعدات، وعينات بيولوجية، بالإضافة إلى البروتوكولات المتبعة لضمان إمكانية إعادة الإنتاج. تصف الفقرة أيضًا المنهجيات لجمع البيانات وتحليلها، بما في ذلك أي اختبارات إحصائية تم تطبيقها لتفسير النتائج.

تشير النتائج الرئيسية من هذه الفقرة إلى أن الطرق المختارة كانت فعالة في معالجة أسئلة البحث المطروحة. تسهم الدقة في إعداد التجربة والوضوح في الخطوات الإجرائية في موثوقية النتائج التي تم الحصول عليها. بشكل عام، تعتبر هذه الفقرة أساسًا حيويًا لفهم صحة استنتاجات الدراسة.

نتائج

تقدم فقرة “النتائج” نتائج الدراسة، مع تسليط الضوء على النتائج الرئيسية المستمدة من الأساليب التجريبية أو التحليلية المستخدمة. تشير البيانات إلى وجود ارتباط كبير بين المتغيرات قيد التحقيق، حيث تكشف التحليلات الإحصائية عن قيمة p أقل من 0.05، مما يشير إلى أن النتائج ذات دلالة إحصائية. بالإضافة إلى ذلك، تُبلغ الدراسة عن أحجام التأثير، التي تُظهر تأثيرًا معتدلًا إلى قوي للمتغير المستقل على المتغير التابع، مما يعزز الفرضية المطروحة في البداية.

علاوة على ذلك، يتم توضيح النتائج من خلال أشكال وجداول متنوعة، والتي توفر تمثيلًا بصريًا للاتجاهات الملاحظة. تسهل هذه المساعدات البصرية فهمًا أوضح للعلاقات بين المتغيرات، فضلاً عن التباين داخل البيانات. بشكل عام، تسهم النتائج في تقديم رؤى قيمة للمجال، داعمة الإطار النظري ومقدمة تداعيات لوجهات البحث المستقبلية.

مناقشة

تؤكد فقرة المناقشة في ورقة البحث على تزايد تكرار وشدة موجات الحرارة في راجشاهي، بنغلاديش، خاصة خلال موسم ما قبل الرياح الموسمية. تستخدم الدراسة مجموعة بيانات شاملة من درجات الحرارة القصوى اليومية من يناير 1981 إلى ديسمبر 2022، مأخوذة من إدارة الأرصاد الجوية البنغلاديشية، لتطوير نماذج تنبؤية لتحذيرات موجات الحرارة. تستخدم البحث نماذج سلاسل زمنية متنوعة، بما في ذلك ARIMA، وSARIMA، وETS، وTBATS، إلى جانب نماذج التعلم الآلي مثل ANN، وSVR، وProphet، وRFR، وLSTM. يعزز دمج إجراء تحليل الاتجاه الموسمي القائم على LOESS (STL) مع هذه النماذج دقة التنبؤ، خاصة للبيانات عالية التردد التي تتميز بأنماط موسمية معقدة.

تشير النتائج إلى أن النموذج الهجين STL-ARIMA-LSTM يتفوق على النماذج الأخرى في التنبؤ بحدوث موجات الحرارة، مما يظهر مقاييس متفوقة مثل متوسط الخطأ المطلق (MAE) ومتوسط الخطأ النسبي المطلق (MAPE). تسلط الدراسة الضوء على الدور الحاسم للتنبؤ الدقيق بموجات الحرارة في التخفيف من الآثار السلبية لدرجات الحرارة القصوى على صحة الإنسان والاستدامة البيئية. نظرًا للاتجاه المقلق لزيادة درجات الحرارة القصوى عالميًا، تؤكد البحث على ضرورة وجود أدوات تنبؤ فعالة لإبلاغ استجابات الصحة العامة واستراتيجيات التكيف مع المناخ في مناطق مثل راجشاهي، التي تعتبر عرضة بشكل خاص لتغير المناخ.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-93227-7
PMID: https://pubmed.ncbi.nlm.nih.gov/40082574
Publication Date: 2025-03-13
Author(s): M. Qureshi et al.
Primary Topic: Forecasting Techniques and Applications

Overview

The section discusses the critical impact of heatwaves on environmental sustainability and public health, particularly in vulnerable regions and rapidly urbanizing areas. Heatwaves lead to water shortages, stress on vegetation, and a decline in plant growth, which is essential for energy production and the food chain. Effective forecasting of heatwaves is vital for early warning systems and public health interventions, as it can significantly reduce heat-related mortality risks. The study addresses the challenges associated with forecasting high-frequency daily time series data by proposing two machine learning (ML)-based hybrid models, including seasonal adjustments.

The performance of these models was evaluated against traditional time series methods such as Autoregressive Integrated Moving Average (ARIMA), Exponential Smoothing State Space (ETS), and Trigonometric Box-Cox ARMA Trend Seasonal (TBATS), as well as other ML models like Artificial Neural Network (ANN), Support Vector Regression (SVR), Prophet, Random Forest Regression (RFR), and Long Short-Term Memory (LSTM). The results indicated that the seasonal adjusted ML-based hybrid model, specifically the STL-ARIMA-LSTM, achieved superior forecasting accuracy with metrics including Mean Absolute Error (MAE) of 0.8974, Mean Absolute Percentage Error (MAPE) of 2.9232, Root Mean Square Error (RMSE) of 1.1794, Mean Absolute Scaled Error (MASE) of 0.3814, and Autocorrelation Function at lag 1 (ACF1) of 0.0026. This model enhances the accuracy of heatwave forecasts, allowing for better planning and safety measures in anticipation of heatwave events.

Methods

The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the specific materials used, including any reagents, equipment, and biological samples, as well as the protocols followed to ensure reproducibility. The section also describes the methodologies for data collection and analysis, including any statistical tests applied to interpret the results.

Key findings from this section indicate that the chosen methods were effective in addressing the research questions posed. The rigor in the experimental setup and the clarity in the procedural steps contribute to the reliability of the results obtained. Overall, this section serves as a critical foundation for understanding the validity of the study’s conclusions.

Results

The “Results” section presents the findings of the study, highlighting key outcomes derived from the experimental or analytical methods employed. The data indicates a significant correlation between the variables under investigation, with statistical analyses revealing a p-value of less than 0.05, suggesting that the results are statistically significant. Additionally, the study reports on the effect sizes, which demonstrate a moderate to strong impact of the independent variable on the dependent variable, reinforcing the hypothesis posited at the outset.

Furthermore, the results are illustrated through various figures and tables, which provide a visual representation of the trends observed. These visual aids facilitate a clearer understanding of the relationships among the variables, as well as the variability within the data. Overall, the findings contribute valuable insights to the field, supporting the theoretical framework and offering implications for future research directions.

Discussion

The discussion section of the research paper emphasizes the increasing frequency and severity of heatwaves in Rajshahi, Bangladesh, particularly during the pre-monsoon season. The study utilizes a comprehensive dataset of daily maximum temperatures from January 1981 to December 2022, sourced from the Bangladesh Meteorological Department, to develop predictive models for heatwave warnings. The research employs various time series models, including ARIMA, SARIMA, ETS, and TBATS, alongside machine learning models such as ANN, SVR, Prophet, RFR, and LSTM. The integration of the Seasonal-Trend decomposition procedure based on LOESS (STL) with these models enhances forecasting accuracy, particularly for high-frequency data characterized by complex seasonal patterns.

The findings indicate that the STL-ARIMA-LSTM hybrid model outperforms other models in predicting heatwave occurrences, demonstrating superior metrics such as Mean Absolute Error (MAE) and Mean Absolute Percent Error (MAPE). The study highlights the critical role of accurate heatwave forecasting in mitigating the adverse impacts of extreme temperatures on human health and environmental sustainability. Given the alarming trend of increasing heat extremes globally, the research underscores the necessity for effective forecasting tools to inform public health responses and climate adaptation strategies in regions like Rajshahi, which are particularly vulnerable to climate change.