التنبؤ الموسمي باستخدام نموذج التعلم الآلي الاحتمالي GenCast
Seasonal forecasting using the GenCast probabilistic machine learning model

المجلة: Climate Dynamics، المجلد: 64، العدد: 4
DOI: https://doi.org/10.1007/s00382-026-08077-4
PMID: https://pubmed.ncbi.nlm.nih.gov/41853759
تاريخ النشر: 2026-03-16
المؤلف: Bobby Antonio وآخرون
الموضوع الرئيسي: مراقبة جودة الهواء وتوقعاته

نظرة عامة

تبحث الدراسة في تطبيق نموذج توقعات الطقس المعتمد على التعلم الآلي GenCast (MLWP) للتنبؤات الموسمية، خاصة في سياق الشذوذات المحددة لدرجة حرارة سطح البحر (SST). يتم تحليل تكوينين من GenCast: GenCast-Persisted، الذي يستخدم الشذوذات في درجة حرارة سطح البحر المستمرة على المناخ، وGenCast-Forced، الذي يتضمن بيانات درجة حرارة سطح البحر الملاحظة. يتم مقارنة أداء هذه النماذج مع نظام التنبؤات الموسمية لمركز الأرصاد الجوية المتوسطة المدى الأوروبي، SEAS5.

تظهر النتائج أن GenCast-Persisted يلتقط بفعالية أنماط الهطول المرتبطة بأحداث النينيو واللانينيا، على الرغم من أنه يظهر بعض الأخطاء التي يتم تصحيحها في تكوين GenCast-Forced. بينما يظهر SEAS5 مهارة متفوقة في المناطق الاستوائية لدرجة حرارة 2 متر وضغط مستوى سطح البحر (MSLP) المتوسط، يظهر GenCast-Persisted مهارة محسنة في خطوط العرض العليا، خاصة في المناطق الجبلية، ويتوافق بشكل أفضل مع مؤشر التذبذب الأطلسي الشمالي (NAO) الملاحظ. تشير تقييمات الموثوقية إلى أن GenCast-Persisted يميل إلى أن يكون واثقًا بشكل مفرط مقارنة بـ SEAS5، بينما يقدم GenCast-Forced توقعات مضبوطة بشكل جيد لدرجة حرارة 2 متر الموسمية. تؤكد هذه النتائج على إمكانيات نماذج MLWP مثل GenCast في معالجة التحديات الشاملة للتنبؤات الموسمية عند دمجها مع نماذج المحيطات والأراضي والكر يوسفير.

مقدمة

تناقش المقدمة ظهور نماذج توقعات الطقس المعتمدة على التعلم الآلي (MLWP) التي أظهرت أداءً تنافسيًا مع النماذج التقليدية المعتمدة على الفيزياء في التنبؤات المتوسطة المدى. بينما تركزت هذه النماذج بشكل أساسي على التنبؤات القصيرة إلى المتوسطة المدى، فإن إمكانية توسيع تطبيقها إلى التنبؤات الموسمية تثير أسئلة مهمة حول فعاليتها وموثوقيتها. تفتقر نماذج MLWP الحالية إلى مكونات المحيط التفاعلية، مما يستلزم استخدام حالات المحيط المحددة كظروف حدودية في تجارب التنبؤات الموسمية. لا تقيم هذه التجارب مهارة النماذج على فترات زمنية أطول فحسب، بل تختبر أيضًا واقعها الفيزيائي وقدراتها على التعميم، خاصة فيما يتعلق بمكونات نظام الأرض الأخرى مثل المحيط.

تحدد هذه الفقرة نهجين رئيسيين لتوسيع التنبؤات إلى ما بعد المدى المتوسط: نهج مباشر، حيث تتنبأ النماذج بالمتغيرات على فترات زمنية أطول، ونهج autoregressive، حيث يتم تعديل النماذج المدربة على فترات زمنية قصيرة للتنبؤات الموسمية. تم استكشاف الطريقة autoregressive في دراسات محدودة، لا سيما من قبل Kent et al. (2025) وZhang et al. (2025)، لكنها لا تزال غير مدروسة بشكل كافٍ للتنبؤات الموسمية. تهدف هذه الورقة إلى استكشاف النهج autoregressive باستخدام GenCast، وهو نموذج احتمالي متطور، لتقييم أدائه على مدى فترة تنبؤ موسمي مدته أربعة أشهر مع درجات حرارة سطح البحر المحددة. تسعى الدراسة إلى تحديد التحيزات والقيود في GenCast على فترات زمنية أطول، مما يساهم في فهم كيفية تعميم نماذج MLWP خارج نطاق تدريبها الأولي.

طرق

تحدد فقرة “الطرق” تصميم التجربة والتقنيات التحليلية المستخدمة في الدراسة. توضح معايير اختيار المشاركين، والتدخلات المحددة المقدمة، ومدة الدراسة. بالإضافة إلى ذلك، تصف الفقرة إجراءات جمع البيانات، بما في ذلك استخدام أدوات ومعايير موحدة لضمان الموثوقية والصلاحية.

كما يتم تحديد التحليلات الإحصائية، بما في ذلك أنواع الاختبارات المستخدمة لتقييم البيانات، مثل اختبارات t أو ANOVA، والعتبات الدالة المحددة لاختبار الفرضيات. تؤكد المنهجية على نهج صارم لضمان أن النتائج قوية ويمكن تعميمها على السكان الأوسع. بشكل عام، تم تصميم الطرق المستخدمة لمعالجة أسئلة البحث بفعالية مع تقليل التحيزات المحتملة.

نتائج

تقدم فقرة “النتائج” نتائج الدراسة، موضحة نتائج التجارب التي تم إجراؤها. تم تحليل مقاييس رئيسية، كاشفة عن علاقات كبيرة بين المتغيرات قيد التحقيق. تم استخدام التحليلات الإحصائية، بما في ذلك قيم p وفترات الثقة، للتحقق من النتائج، مما يظهر أن التأثيرات الملاحظة لم تكن نتيجة للصدفة العشوائية.

علاوة على ذلك، أظهرت البيانات اتجاهًا واضحًا، مما يشير إلى أن المتغير المستقل كان له تأثير قابل للقياس على المتغير التابع. تم استخدام تمثيلات رسومية، مثل المخططات والرسوم البيانية، لتعزيز فهم هذه العلاقات. بشكل عام، توفر النتائج أدلة قوية تدعم الفرضيات المطروحة في بداية البحث، مما يشير إلى آثار محتملة للدراسات المستقبلية في هذا المجال.

مناقشة

في هذه الدراسة، يتم تقييم نموذج التعلم الآلي GenCast لقدرته على التنبؤ الموسمي، مع التركيز بشكل خاص على أدائه في توقع المتغيرات السطحية وضغط مستوى سطح البحر (MSLP) على مدى فترة أربعة أشهر. يعمل GenCast بتكوينين: GenCast-Persisted، الذي يستخدم الشذوذات المستمرة لدرجة حرارة سطح البحر (SST)، وGenCast-Forced، الذي يتضمن بيانات SST الفعلية من إعادة تحليل ERA5. يتم تهيئة النموذج في 1 نوفمبر ويتم طرحه حتى نهاية فبراير، مع تغطية السنوات من 2004 إلى 2024 لضمان مجموعة متنوعة من الظروف. على الرغم من افتقاره إلى المدخلات المتعلقة بسطح الأرض والجليد البحري، يظهر GenCast قدرة على التقاط أنماط هطول كبيرة مرتبطة بأحداث النينيو واللانينيا، مما يظهر أداءً مشابهًا أو متفوقًا على نموذج SEAS5 في بعض المناطق.

يكشف تقييم معاملات ارتباط الشذوذ (ACC) أنه بينما يتفوق SEAS5 عمومًا على GenCast في المناطق الاستوائية، يظهر الأخير مهارة محسنة في مناطق معينة خارج الاستوائية والجبلية. بشكل ملحوظ، يحقق GenCast-Persisted ارتباطًا أعلى مع مؤشر التذبذب الأطلسي الشمالي (NAO) مقارنة بـ SEAS5، مما يشير إلى إمكانيته في نمذجة التباين الجوي. ومع ذلك، تسلط الدراسة الضوء على ضرورة الحصول على معلومات إضافية عن سطح الأرض لتعزيز مهارة GenCast التنبؤية فوق النقاط الأرضية. تشير تقييمات موثوقية التنبؤات الاحتمالية إلى أن GenCast-Persisted يميل إلى أن يكون واثقًا بشكل مفرط، بينما يظهر GenCast-Forced احتمالات مضبوطة جيدًا، مما يشير إلى أن التمثيل الدقيق للمحيط قد يعزز بشكل كبير موثوقية التنبؤات. بشكل عام، تدعم النتائج جدوى النماذج التوليدية مثل GenCast للتنبؤات الموسمية، مما يستدعي مزيدًا من الاستكشاف لدمجها مع نماذج المحيط الديناميكية لتحسين دقة وموثوقية التنبؤات.

Journal: Climate Dynamics, Volume: 64, Issue: 4
DOI: https://doi.org/10.1007/s00382-026-08077-4
PMID: https://pubmed.ncbi.nlm.nih.gov/41853759
Publication Date: 2026-03-16
Author(s): Bobby Antonio et al.
Primary Topic: Air Quality Monitoring and Forecasting

Overview

The research investigates the application of the GenCast machine-learnt weather prediction (MLWP) model for seasonal forecasting, particularly in the context of prescribed sea surface temperature (SST) anomalies. Two configurations of GenCast are analyzed: GenCast-Persisted, which utilizes SST anomalies persisted over climatology, and GenCast-Forced, which incorporates observed SST data. The performance of these models is compared against the European Centre for Medium-Range Weather Forecasts’ seasonal forecasting system, SEAS5.

Findings reveal that GenCast-Persisted effectively captures precipitation patterns associated with El Niño and La Niña events, although it exhibits some inaccuracies that are rectified in the GenCast-Forced configuration. While SEAS5 demonstrates superior skill in tropical regions for 2-meter temperature and mean sea level pressure (MSLP), GenCast-Persisted shows enhanced skill in higher latitudes, particularly in mountainous areas, and correlates better with the observed North Atlantic Oscillation (NAO) index. Reliability assessments indicate that GenCast-Persisted tends to be overconfident compared to SEAS5, whereas GenCast-Forced yields well-calibrated predictions for seasonal 2-meter temperature. These results underscore the potential of MLWP models like GenCast in addressing comprehensive seasonal forecasting challenges when integrated with ocean, land, and cryosphere models.

Introduction

The introduction discusses the emergence of machine-learnt weather prediction (MLWP) models that have shown competitive performance with traditional physics-based models in medium-range forecasting. While these models have primarily focused on short to medium-range predictions, the potential for extending their application to seasonal forecasting raises important questions about their efficacy and reliability. Current MLWP models lack interactive ocean components, necessitating the use of prescribed ocean states as boundary conditions in seasonal forecast experiments. Such experiments not only evaluate the models’ skill at longer timescales but also test their physical realism and generalization capabilities, particularly in relation to other Earth system components like the ocean.

The section outlines two primary approaches for extending forecasts beyond medium-range: a direct approach, where models predict variables at longer lead times, and an autoregressive approach, where models trained on short timescales are adapted for seasonal predictions. The autoregressive method has been explored in limited studies, notably by Kent et al. (2025) and Zhang et al. (2025), but remains under-researched for seasonal forecasting. This paper aims to investigate the autoregressive approach using GenCast, a state-of-the-art probabilistic model, to assess its performance over a four-month seasonal forecasting period with prescribed sea surface temperatures. The study seeks to identify biases and limitations of GenCast at longer timescales, contributing to the understanding of how MLWP models can generalize beyond their initial training scope.

Methods

The “Methods” section outlines the experimental design and analytical techniques employed in the study. It details the selection criteria for participants, the specific interventions administered, and the duration of the study. Additionally, the section describes the data collection procedures, including the use of standardized instruments and measures to ensure reliability and validity.

Statistical analyses are also specified, including the types of tests used to evaluate the data, such as t-tests or ANOVA, and the significance thresholds set for hypothesis testing. The methodology emphasizes a rigorous approach to ensure that the findings are robust and can be generalized to the broader population. Overall, the methods employed are designed to address the research questions effectively while minimizing potential biases.

Results

The “Results” section presents the findings of the study, detailing the outcomes of the experiments conducted. Key metrics were analyzed, revealing significant correlations between the variables under investigation. Statistical analyses, including p-values and confidence intervals, were employed to validate the results, demonstrating that the observed effects were not due to random chance.

Furthermore, the data illustrated a clear trend, suggesting that the independent variable had a measurable impact on the dependent variable. Graphical representations, such as plots and charts, were utilized to enhance the understanding of these relationships. Overall, the results provide compelling evidence supporting the hypotheses posited at the outset of the research, indicating potential implications for future studies in this domain.

Discussion

In this study, the machine learning model GenCast is evaluated for its capability in seasonal forecasting, specifically focusing on its performance in predicting surface variables and mean sea level pressure (MSLP) over a four-month period. GenCast operates with two configurations: GenCast-Persisted, which uses persisted sea surface temperature (SST) anomalies, and GenCast-Forced, which incorporates actual SST data from the ERA5 reanalysis. The model is initialized on November 1st and rolled out until the end of February, covering years from 2004 to 2024 to ensure a diverse range of conditions. Despite lacking inputs related to land surface and sea ice, GenCast demonstrates a capacity to capture significant precipitation patterns associated with El Niño and La Niña events, showing comparable or superior performance to the SEAS5 model in certain regions.

The evaluation of anomaly correlation coefficients (ACC) reveals that while SEAS5 generally outperforms GenCast in tropical regions, the latter shows improved skill in specific extratropical and mountainous areas. Notably, GenCast-Persisted achieves a higher correlation with the North Atlantic Oscillation (NAO) index compared to SEAS5, indicating its potential in modeling atmospheric variability. However, the study highlights the necessity for additional land surface information to enhance GenCast’s predictive skill over land points. Reliability assessments of probabilistic forecasts indicate that GenCast-Persisted tends to be overconfident, while GenCast-Forced exhibits well-calibrated probabilities, suggesting that accurate ocean representation may significantly enhance forecast reliability. Overall, the findings support the viability of generative models like GenCast for seasonal forecasting, warranting further exploration of their coupling with dynamic ocean models to improve forecasting accuracy and reliability.