نموذج تعلم آلي يتفوق على نماذج التنبؤ العالمية التقليدية على المدى الفرعي A machine learning model that outperforms conventional global subseasonal forecast models

المجلة: Nature Communications، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41467-024-50714-1
PMID: https://pubmed.ncbi.nlm.nih.gov/39080287
تاريخ النشر: 2024-07-30

نموذج تعلم آلي يتفوق على نماذج التنبؤ العالمية التقليدية على المدى الفرعي

تاريخ الاستلام: 7 فبراير 2024
تم القبول: 19 يوليو 2024
نُشر على الإنترنت: 30 يوليو 2024

لي تشين شياوهوي تشونغ هاو لي جي وو بو لو ديليانغ تشين © شانغ-بينغ شيا © ليبو وو (ب) تشاو تشينغتشن تشينسن لين © زيكسين هو و يوان

تعتبر التنبؤات المهارية على المدى الفرعي ضرورية لمختلف قطاعات المجتمع، لكنها تمثل تحديًا علميًا كبيرًا. مؤخرًا، تفوقت نماذج التنبؤ بالطقس المعتمدة على التعلم الآلي على أكثر التنبؤات العددية نجاحًا التي تم إنتاجها بواسطة المركز الأوروبي للتنبؤات الجوية متوسطة المدى (ECMWF)، لكنها لم تتجاوز بعد النماذج التقليدية على مقاييس زمنية فرعية. يقدم هذا البحث نموذج FuXi Subseasonal-to-Seasonal (FuXi-S2S)، وهو نموذج تعلم آلي يوفر توقعات يومية عالمية متوسطة تصل إلى 42 يومًا، تشمل خمسة متغيرات جوية علوية عند 13 مستوى ضغط و11 متغيرًا سطحيًا. يتفوق FuXi-S2S، الذي تم تدريبه على 72 عامًا من الإحصائيات اليومية من بيانات إعادة تحليل ECMWF ERA5، على النموذج المتقدم من ECMWF في المتوسط الجماعي والتنبؤات الجماعية لهطول الأمطار الكلي والإشعاع الطويل الخارج، مما يعزز بشكل ملحوظ توقعات هطول الأمطار العالمية. يمكن أن يُعزى الأداء المحسن لـ FuXi-S2S بشكل أساسي إلى قدرته الفائقة على التقاط عدم اليقين في التنبؤ والتنبؤ بدقة بتذبذب مادين-جوليان (MJO)، مما يمدد القدرة على التنبؤ بـ MJO المهاري من 30 يومًا إلى 36 يومًا. علاوة على ذلك، لا يلتقط FuXi-S2S فقط الروابط الواقعية المرتبطة بـ MJO، بل يظهر أيضًا كأداة قيمة لاكتشاف إشارات سابقة، مما يوفر للباحثين رؤى وقد يساهم في إنشاء نموذج جديد في أبحاث علوم نظام الأرض.
توقعات الطقس على المدى الفرعي، التي تتنبأ بأنماط الطقس من 2 إلى 6 أسابيع مقدمًا، تسد فجوة حاسمة بين توقعات الطقس قصيرة المدى، التي عادة ما تصل إلى 15 يومًا، وتوقعات المناخ طويلة المدى التي تمتد إلى فصول زمنية وأطر زمنية أطول. التنبؤ على هذا المقياس الزمني الفرعي الوسيط ضروري لمجموعة متنوعة من التطبيقات، بما في ذلك التخطيط الزراعي، والاستعداد للكوارث، والتخفيف من آثار الأحداث المتطرفة مثل موجات الحر، والجفاف،
الفيضانات، والأجواء الباردة، وإدارة الموارد المائية . على الرغم من فوائدها الاجتماعية والاقتصادية الكبيرة، لم تحظَ التنبؤات تحت الموسمية بالاهتمام الكافي تاريخياً مقارنةً بتنبؤات الطقس والمناخ متوسطة المدى. كان هذا الفجوة موجودة لأن التنبؤات تحت الموسمية الدقيقة كانت تُعتبر في السابق شبه مستحيلة. التنبؤات تحت الموسمية تمثل تحدياً خاصاً لأنها تعتمد على كل من الظروف الأولية الجوية، التي تعتبر أساسية في المدى القصير
توقعات الطقس، وظروف الحدود على سطح الأرض، أساسية للتوقعات الموسمية والمناخية . ومع ذلك، لا توفر أي من هذين الشرطين قابلية التنبؤ الكافية، مما يترك التوقعات تحت الموسمية في ما يسمى بصحراء القابلية للتنبؤ. على الرغم من هذه التحديات، فإن التقدم الأخير في كل من النمذجة الفيزيائية والإحصائية قد مكن من الإنتاج المنتظم للتوقعات تحت الموسمية على مستوى العالم. ومع ذلك، لا يزال هناك طلب قوي مستمر على تطويرها بشكل أكبر لدعم اتخاذ قرارات مستنيرة عبر مختلف القطاعات.
تطوير نظام توقع جماعي (EPS) يعتمد على نماذج التنبؤ الجوي العددي التقليدية المستندة إلى الفيزياء هو طريقة معترف بها على نطاق واسع وفعالة لتحسين دقة التوقعات على المدى الفرعي. لقد نفذت المراكز الرئيسية للتنبؤات مثل هذا النظام للتنبؤات تحت الموسمية. . ومع ذلك، غالبًا ما تظهر هذه الأنظمة تحيزات كبيرة ، لا سيما في التنبؤ بالأحداث المتطرفة التحديان الرئيسيان في هذا المجال هما ضمان حجم مجموعة كافٍ ضمن القيود الحسابية وتصميم الاضطرابات الجماعية التي تعكس بدقة عدم اليقين في التغيرات الرئيسية في الغلاف الجوي والمحيطات. زيادة حجم المجموعة مفيدة لأداء التنبؤ لكن التكاليف الحسابية الكبيرة عادة ما تحد من أحجام الفرق إلى ما بين 4 و 51 عضوًا عبر 11 مركزًا دوليًا للتنبؤ. نظرًا لهذه القيود الحسابية، يظهر نموذج التعلم الآلي كبديل واعد للتنبؤ المباشر على مستوى ما دون الموسم. تمتلك نماذج التعلم الآلي مزايا كفاءة حسابية أعلى بشكل ملحوظ، مما يسهل توليد عدد كبير من أعضاء التجميع، وهو أمر حاسم لمهارة التنبؤ وموثوقيته. التطورات الأخيرة في تعلم الآلة لتوقعات الطقس متوسطة المدى لقد أظهرت أن نماذج التعلم الآلي يمكن أن تتفوق على التوقعات عالية الدقة (HRES) التي ينتجها المركز الأوروبي للتنبؤات الجوية متوسطة المدى (ECMWF)، والذي يُعتبر على نطاق واسع الأكثر دقة في التوقعات الجوية العالمية. .
حققت نماذج التعلم الآلي تقدمًا كبيرًا في التنبؤ بالطقس على المدى المتوسط والتنبؤ الموسمي. لكن نجاحهم في التنبؤات تحت الموسمية كان أقل وضوحًا . هذا النقص ينشأ بشكل أساسي من النطاق المحدود من المتغيرات المدمجة في النماذج، والأهم من ذلك، من الطرق غير الكافية المستخدمة في توليد التجميع. تقنيات التعلم الآلي التقليدية لتوقعات التجميع، مثل إدخال اضطرابات عشوائية في الظروف الأولية وتغيير هياكل النماذج، تتجاهل التدفق الخلفي وبالتالي تؤدي إلى تقليل سريع في انتشار التجميع. التمثيل غير الكافي للتعقيدات يحد من أداء هذه النماذج السابقة المعتمدة على التعلم الآلي للتوقعات تحت الموسمية، التي لا تزال لا تنافس تلك الخاصة بنماذج EPS التقليدية المعتمدة على نماذج NWP. للتغلب على هذه التحديات، نقدم نموذج FuXi Subseasonal-to-Seasonal (FuXi-S2S)، الذي يمثل تقدمًا كبيرًا في التعلم الآلي لتوقعات تحت الموسمية. تم تصميم هذا النموذج لتوليد توقعات يومية عالمية متوسطة لمدة 42 يومًا من التهيئة. على عكس النماذج السابقة التي دمجت مجموعة محدودة من المتغيرات، فإنه يدمج مجموعة شاملة من المتغيرات، بدلاً من عدد قليل من المتغيرات في النماذج السابقة: 5 متغيرات جوية علوية عند 13 مستوى ضغط و11 متغيرًا سطحيًا. علاوة على ذلك، يتميز بوحدة اضطراب مبتكرة مصممة خصيصًا لتوليد اضطرابات تعتمد على التدفق لتوقعات التجميع. تستفيد هذه الوحدة من كميات هائلة من البيانات التاريخية لتعلم توزيعات الاحتمالات، مما يقدم اضطرابات تعتمد على التدفق مباشرة في الميزات المخفية للنموذج. بالمقارنة مع طرق توقعات التجميع التقليدية المعتمدة على NWP، التي غالبًا ما تواجه صعوبة في بناء اضطرابات الظروف الأولية بسبب تعقيدات التفاعلات متعددة المتغيرات والحاجة إلى الحفاظ على التوازن الديناميكي وانتشار التجميع في المحاكاة. نهجنا في إدخال الاضطرابات مباشرة في الفضاء الكامن للنموذج، مما يقدم بديلاً فعالاً. تعزز هذه الوحدة الاضطرابية بشكل كبير أداء توقعات FuXi-S2S، كما هو موضح
في الشكل التوضيحي التكميلي 1. تتوفر مزيد من التفاصيل حول بنية نموذج FuXi-S2S في “الطرق”.
من المRemarkably، يتفوق FuXi-S2S على مجموعة ECMWF من النماذج الموسمية إلى الموسمية (S2S)، والتي تُعتبر الأكثر كفاءة في نظام النمذجة S2S، في إنتاج كل من المتوسط الجماعي والتوقعات الاحتمالية. تظهر فعاليته بشكل خاص في التنبؤ بالهطول الكلي الشديد (TP)، كما يتضح من توقعاته الدقيقة لفيضانات باكستان في عام 2022. ترتبط هذه القدرة ارتباطًا وثيقًا بتحسين FuXiS2S في التنبؤ بتذبذب مادن-جوليان (MJO). “، وهو محرك رئيسي لأنماط المناخ العالمية، مما يمدد القدرة على التنبؤ الدقيق بـ MJO من 30 يومًا إلى 36 يومًا. تؤكد هذه النتائج بشكل أكبر أن التحسن الملحوظ في أداء FuXi-S2S يمكن أن يُعزى بشكل أساسي إلى وحدة الاضطراب المبتكرة لتوليد التجميع. نتيجة واعدة أخرى هي قدرة نموذج FuXi-S2S على تحديد إشارات سابقة محتملة للعمليات الفيزيائية. بالإضافة إلى الدقة البسيطة، في العديد من التطبيقات التي تتضمن توقعات التعلم الآلي، من الضروري فهم والتحقق من آليات اتخاذ القرار لهذه النماذج. مثل هذا الفهم لا يؤدي فقط إلى تعزيز الثقة في توقعات النماذج، بل يزيد أيضًا من احتمالية تنفيذ إجراءات فعالة، لا سيما في التخفيف من المخاطر المرتبطة بالأحداث المتطرفة. لذلك، يصبح تفسير نماذج التعلم الآلي ليتماشى مع المعرفة الراسخة أمرًا حيويًا. التطورات الأخيرة في التعلم الآلي القابل للتفسير لقد سهلت الأساليب هذه التفسير. تتناول هذه الدراسة فيضانات باكستان لعام 2022، حيث تحقق في توقعات نموذج FuXi-S2S لتحديد المناطق الجغرافية الرئيسية التي تؤثر بشكل كبير على دقة توقعاته. يتم تحقيق ذلك من خلال إنشاء وتحليل خرائط الأهمية. حيث تتماشى المناطق المحددة بشكل وثيق مع الرؤى المستخلصة من الدراسات السابقة لذلك، نرى أن نموذج FuXi-S2S يتجاوز النماذج التقليدية للتنبؤ بالطقس من حيث الدقة والسرعة، مما قد يكشف عن عمليات لم يتم التعرف عليها سابقًا ضمن نظام الأرض في التنبؤات دون الشهر. .

النتائج

تجري هذه الدراسة تقييمًا شاملاً لتوقعات FuXi-S2S المكونة من 51 عضوًا من خلال تحليل بيانات الاختبار التي تمتد من عام 2017 إلى عام 2021. وتقارن أداء مع تلك الخاصة بإعادة التنبؤات من نموذج ECMWF S2S المكون من 11 عضوًا من دورة النموذج C47r3 خلال نفس الفترة. تركز التحليل بشكل أساسي على التنبؤات المتوسطة للأسبوع الثالث (الأيام 15-21)، والأسبوع الرابع (الأيام 22-28)، والأسبوع الخامس (الأيام 29-35)، والأسبوع السادس (الأيام 36-42)، والأسابيع 3-4، والأسابيع 5-6. تستخدم التقييم مجموعة شاملة من المقاييس، بما في ذلك المقاييس الحتمية لمتوسط المجموعة، والمقاييس الاحتمالية لجميع أعضاء المجموعة، ومهارات التنبؤ المحددة لتنبؤات MJO، وتقييمات مخصصة للأحداث المتطرفة، ولا سيما فيضانات باكستان 2022. علاوة على ذلك، تستكشف الدراسة العمليات الأساسية التي تقود تنبؤات نموذج FuXi-S2S لفيضانات باكستان 2022. يتم ذلك من خلال إنشاء وتحليل خرائط الأهمية، التي توفر رؤى عميقة في عمليات التنبؤ الخاصة بالنموذج.
تقييمات إضافية، بما في ذلك تحليل طيف الطاقة متاحة في المواد التكميلية.

المقاييس الحتمية

يقارن هذا القسم الفرعي أداء توقعات المتوسط الجماعي من FuXi-S2S و ECMWF S2S استنادًا إلى مقاييس حتمية. تقدم الشكل 1 معامل ارتباط الشذوذ الزمني (TCC) المتوسط عالميًا والموزون حسب خط العرض لكل من FuXi-S2S و ECMWF S2S، مع الأخذ في الاعتبار أربعة متغيرات: TP، ودرجة حرارة 2 متر (T2M)، والجيوبوتينشيل عند 500 هكتوباسكال (Z500)، والإشعاع الطويل الموجي الخارج (OLR)، عبر أوقات التوقع. ، و أسابيع. يتم إجراء اختبار الدلالة كما هو موضح في “طريقة التقييم”. عندما لا تظهر توقعات FuXi-S2S تحسنًا ذا دلالة إحصائية مقارنة بتوقعات ECMWF S2S، يتم الإشارة إلى ذلك باستخدام نظام ألوان باهت. من الواضح أن المتوسط الجماعي
الشكل 1 | مقارنة معامل ارتباط الشذوذ الزمني المتوسط عالميًا والموزون حسب خط العرض (TCC) للمتوسط الجماعي بين إعادة التنبؤات قصيرة المدى إلى موسمية (S2S) من ECMWF (باللون الأزرق) وتنبؤات FuXi-S2S (باللون الأحمر) لهطول الأمطار الكلي (TP) ودرجة حرارة 2 متر (T2M) والجيوبوتينسيال عند 500 ، والإشعاع الطويل الموجي الخارج (OLR). تمثل الصفوف 1 و 2
فوكسى-إس2إس

الأداء عبر هذه المتغيرات، باستخدام جميع بيانات الاختبار من الفترة الممتدة من 2017 إلى 2021. تم استخدام نهج البوتستراب، الذي تم تكراره 1000 مرة، لاختبار الدلالة. عندما تفشل توقعات FuXi-S2S في إظهار تحسين ذو دلالة إحصائية مقارنة بتوقعات ECMWF S2S في مستوى الثقة، يتم استخدام نظام ألوان باهت للإشارة إلى هذه النتائج.
تتجاوز توقعات FuXi-S2S بشكل كبير توقعات ECMWF S2S بالنسبة لهطول الأمطار (TP) والإشعاع الشمسي الخارجي (OLR)، ولكن ليس بالنسبة لدرجة الحرارة عند 2 متر (T2M) والضغط الجوي عند 500 هكتوباسكال (Z500). التحليل يعتمد على متوسط معامل الارتباط (TCC) المحسوب من جميع بيانات الاختبار التي تغطي الفترة من 2017 إلى 2021. بشكل عام، تظهر توقعات FuXi-S2S قيم TCC أعلى من توقعات ECMWF S2S لإجمالي الهطول (TP) والإشعاع الشمسي الخارجي (OLR) في جميع أوقات التنبؤ، بينما تظهر قيم TCC متقاربة بالنسبة للضغط الجوي عند 500 هكتوباسكال (Z500) ودرجة الحرارة عند 2 متر (T2M). بشكل محدد، فيما يتعلق بالضغط الجوي عند 500 هكتوباسكال (Z500)، فإن توقعات FuXi-S2S تتفوق على توقعات ECMWF S2S في أوقات التنبؤ. ، و أسابيع، ولديها أداء أقل عند أوقات تسليم تتراوح بين 6 و 5-6 أسابيع.
يوفر الشكل التوضيحي الإضافي 2 التوزيعات المكانية لـ TCC المتوسطة زمنياً لكل من ECMWF S2S وFuXi-S2S، بالإضافة إلى الفروقات في TCC بين FuXi-S2S وECMWF S2S لتوقعات TP وT2M وZ500 وOLR في أوقات التقديم لـ و أسابيع، على التوالي. تكشف التوزيعات المكانية لمؤشر الترابط الزمني (TCC) عن قيم أعلى بكثير فوق المناطق الاستوائية، وقيم أكبر فوق المحيطات مقارنةً باليابسة. يتم وصف الفروقات في TCC بالألوان الحمراء (قيم إيجابية)، والزرقاء (قيم سلبية)، والبيضاء (قيم صفرية)، مما يشير إلى ما إذا كانت أداء FuXi-S2S متفوقًا، أو أدنى، أو معادلًا لأداء ECMWF S2S، على التوالي. بشكل عام، يظهر FuXi-S2S فروقات إيجابية في TCC بالنسبة لـ TP و OLR في معظم المناطق حول العالم، متسقة مع النتائج المعروضة في الشكل 1. علاوة على ذلك، يتفوق FuXi-S2S أيضًا على ECMWF في الغالبية العظمى من المناطق خارج الاستوائية لكل من T2M و Z500، على الرغم من أن أدائه عمومًا أقل كفاءة في المناطق الاستوائية.

المقاييس الاحتمالية

تظهر المقاييس الحتمية، التي تم تقييمها باستخدام المتوسط الجماعي، مهارات تنبؤية محدودة، حيث تكون قيم TCC أقل من 0.5 لجميع أوقات التنبؤ تحت الموسمية. لذلك، فإن التنبؤات الجماعية ضرورية لاكتشاف الإشارات القابلة للتنبؤ على مقاييس زمنية تحت موسمية.
تقدم الصفحتان الأوليان من الشكل 2 التوزيع المكاني لدرجة مهارة الاحتمال المرتبة المتوسطة زمنياً (RPSS) لـ ECMWF S2S و FuXi-S2S، بالإضافة إلى اختلافات RPSS بين FuXi-S2S و ECMWF S2S لتوقعات TP على مدى 3-4 و 5-6 أسابيع. تستخدم هذه التحليل بيانات RPSS التي تم متوسطها زمنياً من 2017 إلى 2021. تبرز خطوط الكنتور الحمراء في العمودين الأول والثاني المناطق ذات قيم RPSS الإيجابية، والتي تشير إلى إمكانية الحصول على توقعات أكثر دقة من توقعات المناخ في هذه المناطق. من الجدير بالذكر أن FuXi-S2S يتوقع المزيد من المناطق ذات قيم RPSS الإيجابية مقارنة بـ ECMWF S2S. يوضح الترميز اللوني في الألواح اليمنى من الشكل 2.
(الأحمر، الأزرق، والأبيض) تشير إلى المناطق التي يكون فيها أداء FuXi-S2S أفضل أو أسوأ أو مكافئ مقارنة بـ ECMWF S2S، على التوالي. تشير التوزيعات العالمية لـ RPSS إلى أن كل من ECMWF S2S و FuXi-S2S تظهران بشكل أساسي مهارة في المناطق الاستوائية، بينما تفتقران إلى المهارة في المناطق خارج الاستوائية مقارنة بالمناخ. على النقيض من ذلك، يظهر RPSS قيمًا إيجابية (موضحة باللون الأحمر) في المناطق الاستوائية، مما يشير إلى مهارات تنبؤية محسنة مقارنة بالمناخ. علاوة على ذلك، فإن قيم RPSS أعلى بشكل ملحوظ فوق المحيطات مقارنة بالمناطق البرية. بشكل عام، يظهر FuXi-S2S اختلافات إيجابية في RPSS تقريبًا على مستوى العالم بالنسبة لـ TP، باستثناء بعض المناطق الاستوائية حيث تمتلك كلا النموذجين قيم RPSS مرتفعة جدًا. مقارنةً بـ ECMWF S2S، التي تقتصر تنبؤاتها المهارية بشكل أساسي على مناطق المحيطات الاستوائية، يظهر FuXi-S2S القدرة على تقديم تنبؤات مهارية على المزيد من المناطق خارج الاستوائية، مثل شرق آسيا، شمال المحيط الهادئ، والقطب الشمالي.
مؤشر RPSS الموزون حسب خط العرض لنفس الأربعة متغيرات كما في الشكل 1 على مدى أوقات التنبؤ ، و تُعطى الأسابيع في الشكل التوضيحي 6. يُظهر FuXi-S2S قيم RPSS أعلى من ECMWF S2S عبر معظم المناطق لجميع المتغيرات المدروسة: TP و T2M و Z500 و OLR. هذه الأفضلية ملحوظة بشكل خاص في المتوسطات خارج المناطق الاستوائية. ومع ذلك، في المناطق الاستوائية، يتفوق ECMWF S2S على FuXi-S2S في فترات التنبؤ من 3 إلى 6 أسابيع لمتوسطات الأسبوع الواحد، بينما يتفوق FuXi-S2S على ECMWF S2S لمتوسطات الأسبوعين. من المحتمل أن تنشأ هذه الفجوة في الأداء من حقيقة أن متوسطات الأسبوع الواحد تصفي التباين بفترات أقصر من أسبوعين، بينما تخفف متوسطات الأسبوعين التباين بفترات أقصر من 4 أسابيع. وبالتالي، قد تعكس الفروق في المهارة بين متوسطات الأسبوع الواحد والأسبوعين قدرة FuXi-S2S المحسنة في التقاط التباين منخفض التردد. علاوة على ذلك، تشير دراسة سابقة إلى أن نماذج S2S الديناميكية، وخاصة ECMWF S2S، تُظهر أداءً محسناً في وسط شرق المحيط الهادئ، ربما بسبب محاكاتها الفعالة للتفاعلات الواقعية بين الهواء والبحر في هذه المناطق.

تنبؤات متطرفة

الهدف الرئيسي من التنبؤات تحت الموسمية هو الأحداث الجوية المتطرفة، للاستعداد بشكل أفضل للكوارث مثل الجفاف والفيضانات. تركز هذه الفقرة على مهارات التنبؤ للأحداث المتطرفة من الأمطار. يتم تحديد مثل هذه الأحداث عندما يتجاوز TP النسبة المئوية 90.
الشكل 2 | خرائط تعرض متوسط درجة مهارة الاحتمالية المرتبة (RPSS) (الصفين الأول والثاني) ودرجة مهارة بريير (BSS) (الصفين الثالث والرابع) بدون وزن خط العرض، مقارنةً بتنبؤات ECMWF تحت الموسمية إلى الموسمية (S2S) (العمود الأول) و FuXi-S2S (العمود الثاني). بالإضافة إلى ذلك، يُظهر العمود الثالث الفرق في RPSS و BSS بين FuXi-S2S و ECMWF S2S لإجمالي الأمطار (TP) في أوقات التنبؤ من الأسابيع (الصفين الأول والثالث) والأسابيع 5-6 (الصفين الثاني والرابع)، باستخدام جميع بيانات الاختبار من 2017 إلى 2021.
تشير خطوط الكنتور الحمراء في العمودين الأول والثاني إلى المناطق التي تحتوي على قيم إيجابية من RPSS و BSS. تشير النقاط المتقطعة على الخريطة إلى المناطق التي تكون فيها درجة المهارة ذات دلالة إحصائية عند مستوى ثقة 97.5%. بشكل محدد، في العمودين 1 و 2، تشير النقاط المتقطعة إلى المناطق التي تتجاوز فيها درجات المهارة لنماذج ECMWF S2S و FuXi-S2S بشكل كبير تلك الخاصة بالمناخ. في العمود 3، تبرز النقاط المتقطعة المناطق التي يتفوق فيها نموذج FuXi-S2S بشكل كبير على ECMWF S2S.
النسبة المئوية، وهو حد يختلف بناءً على موقع الشبكة، ووقت بدء التنبؤ، ووقت التنبؤ.
تظهر الصفين الأخيرين من الشكل 2 التوزيعات المكانية لدرجة مهارة بريير المتوسطة زمنياً (BSS) لأحداث الأمطار المتطرفة، لـ ECMWF S2S و FuXi-S2S، والفروق بينها على فترات التنبؤ من 3-4 و 5-6 أسابيع. مشابهًا للنمط المكاني لـ RPSS، يُظهر FuXi-S2S عمومًا المزيد من المناطق ذات القيم الإيجابية من BSS مقارنةً بـ ECMWF S2S، مما يشير إلى المزيد من المناطق ذات المهارة بالنسبة للتنبؤات المناخية. مشابهًا للنمط المكاني لـ RPSS، فإن قيم BSS أعلى بكثير فوق المحيطات مقارنةً بالأراضي وتتناقص من خطوط العرض المنخفضة إلى العالية. بشكل رئيسي، تفضل الفروق في BSS FuXi-S2S في TP فوق اليابسة وفي المناطق خارج الاستوائية، مما يدل على أنماط حمراء واسعة الانتشار. وهذا يشير إلى هيمنة FuXi-S2S على ECMWF S2S في التنبؤ بـ TP المتطرف عبر اليابسة والمناطق خارج الاستوائية، وهو أمر ذو أهمية كبيرة للاستعداد للكوارث والتحذير المبكر.
يقارن الشكل التوضيحي 7 بين BSS الموزون حسب خط العرض بين FuXi-S2S و ECMWF S2S، مع التركيز على TP و T2M و Z500 و OLR في خمس مناطق جغرافية: عالمية، في المناطق خارج الاستوائية ( و )، في المناطق الاستوائية ( )، فوق اليابسة، وفوق المحيط. على المستوى العالمي، يتفوق FuXi-S2S على ECMWF S2S من حيث BSS لـ TP و T2M و OLR. من الجدير بالذكر، على عكس ECMWF S2S،
الذي يظهر قيم BSS سلبية باستمرار على مستوى العالم لـ TP عبر جميع أوقات التنبؤ، يُظهر FuXi-S2S قيم إيجابية لأوقات التنبؤ بـ ، و أسابيع. في المناطق خارج الاستوائية، على الرغم من أن درجات BSS أقل نسبيًا مقارنةً بالمتوسط العالمي، إلا أن FuXi-S2S يظهر أداءً متفوقًا باستمرار مقارنةً بـ ECMWF S2S عبر جميع المتغيرات الأربعة. يظهر نمط مشابه في المناطق الاستوائية، حيث يُظهر FuXi-S2S أداءً متفوقًا على ECMWF S2S لـ TP و OLR بينما يحقق دقة مماثلة في T2M و Z500. فوق المناطق اليابسة، يُظهر FuXi-S2S قيم BSS أعلى باستمرار لـ TP و T2M، مما يشير إلى قدرته المتفوقة على تقديم تنبؤات أكثر دقة للأمطار المتطرفة ودرجات الحرارة العالية مقارنةً بـ ECMWF S2S.

تنبؤ MJO

أظهرت الدراسات الحديثة أهمية نمذجة مصادر مختلفة من القابلية للتنبؤ تحت الموسمية بدقة، وخاصةً ، لتحسين مهارات التنبؤ تحت الموسمية. يؤثر MJO بشكل كبير على الطقس والمناخ العالمي، ويعمل كمصدر رئيسي للقابلية للتنبؤ على مقاييس زمنية تحت الموسمية بسبب طبيعته شبه الدورية . يعد التنبؤ الدقيق بـ MJO أمرًا ضروريًا للتنبؤات تحت الموسمية الموثوقة. على الرغم من أن التنبؤات الديناميكية الحديثة يمكن أن تتنبأ بـ MJO حتى 3-4 أسابيع مقدمًا،
الشكل 3 | مقارنة بين التذبذب المتعدد المتغيرات في مادن-جوليان (MJO) (RMM) وارتباط ثنائي المتغير (COR) لوسائل المجموعة بين إعادة التنبؤات تحت الموسمية إلى الموسمية لـ ECMWF (باللون الأزرق) وتنبؤات FuXi-S2S (باللون الأحمر) باستخدام جميع بيانات الاختبار من 2017 إلى 2021. أ مقارنة بين RMM COR الثنائي المتغير كدالة لأوقات التنبؤ. تشير الخط الأسود المنقط إلى عتبة مهارة التنبؤ
من . يتم تصوير RMM COR الثنائي المتغير كدالة لشهر بدء التنبؤ (المحور السيني) ووقت التنبؤ (المحور الصادي)، مع الإشارة إلى أيام التنبؤ المهارية لـ MJO لـ ECMWF S2S (باللون الأزرق) و FuXiS2S (باللون الأحمر)، على التوالي.
هذا لا يفي بالإمكانات النظرية للتنبؤ التي تبلغ حوالي 6-7 أسابيع . في السنوات الأخيرة، زادت الجهود المركزة على تطبيق نماذج التعلم الآلي لتحسين تنبؤات MJO، إما من خلال معالجة ما بعد التنبؤات الديناميكية أو من خلال التنبؤ المباشر . ومع ذلك، فإن تحسين تنبؤات MJO فقط باستخدام نماذج التعلم الآلي لا يضمن بالضرورة تحسين التنبؤات للظواهر الجوية ذات الصلة، مثل الأعاصير الاستوائية والموسميات، التي تعتمد أيضًا على التنبؤات الدقيقة لمختلف معلمات الطقس بواسطة النموذج. لذلك، فإن التحسين المستمر في نماذج التنبؤ أمر ضروري لتعزيز قدرات التنبؤ تحت الموسمية. تتناول هذه الفقرة بشكل خاص أداء نموذج FuXi-S2S لدينا في تنبؤات MJO، على الرغم من أنه لم يتم تحسينه صراحةً لهذا الغرض.
في هذه الدراسة، استخدمنا مؤشر MJO المتعدد المتغيرات في الوقت الحقيقي (RMM) , جنبًا إلى جنب مع المقاييس الشائعة لاختبار معامل الارتباط الثنائي (COR) ، لتقييم مهارة التنبؤ بـ MJO. تم حساب مؤشر RMM المستخدم للتحقق باستخدام بيانات OLR (CBO) من مركز التنبؤ المناخي (CPC) ، بالتزامن مع مكون الرياح العرضية ERA5 عند 850 هكتوباسكال و 200 هكتوباسكال. تقدم الشكل 3 مهارات الارتباط الثنائي (COR) لمؤشر RMM لمتوسط مجموعة توقعات ECMWF S2S وتوقعات FuXi-S2S ، المتوسطة على بيانات الاختبار التي تمتد من 2017 إلى 2021. تظهر النتائج انخفاضًا في قيم COR مع زيادة أوقات التنبؤ. بشكل خاص ، يتفوق FuXi-S2S على ECMWF S2S في توقع MJO ، مع الحفاظ على قيم COR أعلى لمدة تصل إلى 42 يومًا. عند تطبيق عتبة COR تبلغ 0.5 لتحديد توقع MJO المهاري ، يمدد FuXi-S2S فترة التنبؤ المهاري من 30 يومًا إلى 36 يومًا ، متجاوزًا أداء ECMWF S2S. علاوة على ذلك ، تعتمد مهارات توقع MJO أيضًا على الدورة الموسمية ، كما هو موضح في الشكل 3. يظهر كل من FuXi-S2S و ECMWF S2S مهارات أعلى في توقع MJO في سبتمبر وأكتوبر. بالإضافة إلى ذلك ، يظهر FuXi-S2S مهارات متفوقة مقارنة بـ ECMWF S2S خلال الربيع الشمالي والشتاء ، مع توقعات مهارية تمتد لأكثر من 42 يومًا في أبريل ومايو ، وهو أطول وقت للتنبؤ يمكن تحقيقه بواسطة نموذج FuXi-S2S. علاوة على ذلك ، يقدم الشكل التكميلية 9 COR والخطأ في السعة والطور لـ MJO. يتم حساب هذه باستخدام متوسط مجموعة توقعات ECMWF S2S وتوقعات FuXi-S2S ، المتوسطة عبر مجموعة بيانات الاختبار من 2017 إلى 2021. تشير النتائج إلى أن نموذج FuXi-S2S يتفوق على نموذج ECMWF S2S في توقع MJO ، ويرجع ذلك أساسًا إلى قدرته المتفوقة في
توقع طور MJO. بالإضافة إلى ذلك ، يظهر FuXi-S2S أخطاء سعة أصغر ، مما يشير إلى أنه يحافظ بدقة أكبر على سعة أحداث MJO.
يتم استخدام مخطط فضاء الطور ثنائي الأبعاد بشكل شائع لوصف الطور والسعة لـ MJO ، باستخدام المحور السيني والمحور الصادي لتمثيل المكونات الرئيسية الأولى والثانية للدوال المتعامدة التجريبية (EOFs) (RMM1 و RMM2) ، على التوالي. يوضح الشكل التكميلية 10 أداء التنبؤ لأربعة أحداث MJO متميزة مع تواريخ بدء 27 يونيو 2018 و 3 نوفمبر 2018 و 18 أبريل 2019 و 21 مارس 2021 ، كما تم التنبؤ بها بواسطة ECMWF S2S و FuXi-S2S. يتم رسم نقاط البيانات على هذا المخطط ثنائي الأبعاد على فترات 5 أيام. يتم تحديد طور MJO بواسطة الزاوية لمؤشرات RMM المجمعة 1 و 2 (RMM1 و RMM2) ، بينما يتم تمثيل سعتها بواسطة المسافة الشعاعية من الأصل. كما هو موضح بصريًا في الشكل التكميلية 10 ، تشير الحركة المعاكسة لعقارب الساعة لنقاط البيانات إلى الانتشار الشرقي للتكثف المرتبط بـ MJO ، مع المسافة بين النقاط المتعاقبة تعكس سرعة الانتشار. بالمقارنة مع MJO الملاحظ المستمد من بيانات CBO و ERA5 ، يظهر كل من ECMWF S2S و FuXi-S2S سرعات انتشار أبطأ وسعات أقل مع زيادة وقت التنبؤ ، وهو ما يلاحظ بشكل خاص لتوقعات MJO التي بدأت في 21 مارس 2021. ومع ذلك ، يظهر FuXi-S2S توافقًا أكثر اتساقًا مع الملاحظات عبر جميع أطوار MJO ، خاصة في التخفيف من الانحيازات السلبية في السعة في توقعات MJO عند مقارنتها بـ ECMWF S2S.
تنشأ MJO من تفاعلات التكثف المداري والدوران ولكن تأثيرها يمتد على مستوى عالمي. في الواقع ، تم العثور على TCC كبير لـ Z500 فوق المحيط الهادئ خارج الاستوائي على طول مسار نمط الاتصال البعيد بين المحيط الهادئ شمال/جنوب أمريكا (PNA/PSA) (الشكل التكميلية 2 ، الصفوف 6 و 7). بالمقارنة مع ECMWF S2S ، فإن تحسين توقع MJO في FuXi-S2S يرفع TCC لهذه الأنماط الاتصال البعيد ، خاصة على طول قطار الموجة PSA في نصف الكرة الجنوبي. علاوة على ذلك ، تعتبر MJO حاسمة في تحفيز هذه الأنماط الاتصال البعيد المهمة ، مما يؤثر بشكل كبير على الشذوذات خارج الاستوائية. لذلك ، فإن التمثيل الدقيق للاتصالات البعيدة المرتبطة بـ MJO أمر ضروري للتنبؤات الفعالة على المدى القصير. يوضح الشكل التكميلية 11 أن نموذج FuXi-S2S يظهر مهارات محسنة في توقع MJO والمحاكاة الواقعية للاتصالات البعيدة لـ MJO ، مما يساهم بشكل كبير في أدائه المتفوق في التنبؤات على المدى القصير ، خاصة فوق المناطق خارج الاستوائية.
الشكل 4 | تحليل مقارن لتوقعات الفيضانات في باكستان لعام 2022 بين نماذج ECMWF للتنبؤات على المدى القصير إلى الموسمي (S2S) و FuXi-S2S بالإضافة إلى إشارات سابقة ساهمت في توقعات دقيقة من نموذج FuXi-
S2S. مقارنة بين متوسطات الهطول الكلي القياسية (TP) (أ) على مدى أسبوعين من 16 أغسطس إلى 31 أغسطس 2022 ، تعرض ملاحظات GPCP (بالأسود) جنبًا إلى جنب مع توقعات ECMWF S2S في الوقت الحقيقي (بالأزرق) وتوقعات FuXi-S2S (بالأحمر) ، مع تواريخ بدء: 11 أغسطس (08-11 ، MM-DD) ، 8 أغسطس (08-08) ، 4 أغسطس (08-04) ، 1 أغسطس (08-01) ، 28 يوليو (07-28) ، 25 يوليو (07-25) ، و 21 يوليو (07-21). تمثل الخطوط السوداء على شريط توقعات ECMWF S2S و FuXi-S2S النسب المئوية 25 و 75. بالنسبة لمقارنة خرائط متوسطات TP القياسية (ب) ، يمثل العمود الأول ملاحظات GPCP ، بينما يعرض العمودان الثاني و
الثالث توقعات من ECMWF S2S و FuXi-S2S ، على التوالي ، وكلاهما بدأ في 28 يوليو ، بينما يتوافق العمودان الرابع والخامس مع توقعات من ECMWF S2S و FuXi-S2S ، على التوالي ، مع تاريخ بدء 21 يوليو. يشير الخط الأخضر إلى خط الحدود لباكستان. تم إنشاء خرائط الأهمية (ج) باستخدام تدرج الانحراف القياسي السلبي لـ TP ، المتوسطة عبر منطقة باكستان ، فيما يتعلق بدرجات حرارة سطح البحر المدخلة. تتوافق هذه الخرائط مع توقعات بدأت في 28 يوليو (07-28 ، العمود الأول) و 21 يوليو (0721 ، العمود الثاني). هنا ، تشير الألوان الحمراء والزرقاء إلى الارتباطات الإيجابية والسلبية بين السالب من TP القياسي والانحرافات في درجات حرارة سطح البحر. تمثل الخطوط السوداء على القضبان في هذا الشكل النسب المئوية 25 و 75 للتوقعات الجماعية لكل تاريخ بدء لكل من نماذج ECMWF و FuXi-S2S.
تسلط هذه الدراسة الضوء على كفاءة FuXi-S2S في توقع MJO. نتخيل أن FuXi-S2S يمكن أن يكون أداة محورية في التحقيق في أنماط أخرى رئيسية من التغيرات على المدى القصير ، مثل التذبذب المداري الصيفي الشمالي (BSISO) , التذبذب الأطلسي الشمالي (NAO) , ونمط شرق آسيا-المحيط الهادئ (EAP) . بالإضافة إلى ذلك ، سيكون من المفيد استكشاف كيف يؤثر درجة حرارة سطح البحر الثابتة المحددة أو غيابها على أداء توقعات MJO. أظهر سافارين وتشين أن استخدام نموذج مرتبط بين الغلاف الجوي والمحيط أو تحديث درجة حرارة سطح البحر بالقيم الملاحظة أمر ضروري لنمذجة دقيقة لانتشار MJO شرقًا. ومع ذلك ، فإن هذا التحليل يتجاوز نطاق الدراسة الحالية وسيتم تناوله في الأبحاث المستقبلية.

توقع الفيضانات في باكستان

في عام 2022 ، شهدت باكستان سلسلة من الارتفاعات الشديدة في هطول الأمطار الموسمية من أوائل يوليو إلى أواخر أغسطس ، مما أدى إلى هطول إجمالي
الأمطار التي وصلت إلى مستوى يزيد عن أربع انحرافات معيارية فوق المتوسط المناخي . أدى هذا الحدث الشديد من الأمطار إلى كارثة إنسانية كبيرة ، تاركًا أكثر من 2.1 مليون شخص بلا مأوى وأسفر عن 1730 حالة وفاة. وفقًا للبنك الدولي ، تجاوزت الأضرار والخسائر الاقتصادية 30 مليار دولار أمريكي . وبالتالي ، من المهم تقييم قدرة التوقعات على المدى القصير في التنبؤ بمثل هذه الأحداث الشديدة من الأمطار.
يوضح الشكل 4 الانحراف القياسي الملحوظ لـ TP جنبًا إلى جنب مع التوقعات التي بدأت في تواريخ مختلفة ، التي تم إنشاؤها بواسطة كل من نماذج FuXi-S2S و ECMWF S2S. تم أخذ هذه الملاحظات من مشروع المناخ العالمي لهطول الأمطار (GPCP) ، وهي متوسطة مكانيًا عبر منطقة باكستان ( في خط الطول و في خط العرض)، وعلى مدى فترة زمنية مدتها أسبوعان من 16 أغسطس إلى 31 أغسطس 2022، والتي تتوافق مع فترة هطول الأمطار الأكثر كثافة. الشذوذ المعياري لهطول الأمطار المرصودة هو انحرافات معيارية فوق المتوسط المناخي. من الواضح أن
نموذج ECMWF S2S يقلل بشكل كبير من تقدير شدة هطول الأمطار للتوقعات التي تم تهيئتها في 21 يوليو، حيث حقق فقط حوالي ثلث القيم المرصودة. تتقارب توقعات ECMWF S2S تدريجياً نحو الملاحظات مع اقتراب تواريخ التهيئة من الحدث الفعلي. بالمقابل، يظهر نموذج FuXi-S2S أداءً أفضل في توقع شدة أحداث هطول الأمطار الشديدة في وقت مبكر مقارنة بنموذج ECMWF S2S. على وجه التحديد، يتوقع نموذج FuXi-S2S مستويات هطول أمطار لا تقل عن 4 انحرافات معيارية فوق المتوسط المناخي للتوقعات التي تم تهيئتها في 21 يوليو، وهو ما يقدر بحوالي 4 أسابيع مسبقاً. علاوة على ذلك، تكشف التوزيعات المكانية لشذوذ TP المعياري أن نمط TP المتوقع من FuXi-S2S يتطابق بشكل أقرب مع الملاحظات.
عادة ما تتحسن مهارة التوقع مع تقليل زمن التقديم، كما هو الحال في نموذج ECMWF S2S. ينمو شذوذ هطول الأمطار في توقعات FuXi-S2S التي تم تهيئتها في 28 يوليو (زمن تقديم 18 يوماً)، على الرغم من وجود انتشار كبير في التوقعات، ربما بسبب تأثير SST. في الواقع، تُظهر خرائط الأهمية أن توقعات FuXi-S2S التي تم تهيئتها في 28 يوليو و21 يوليو قد نجحت في التقاط إشارات قابلة للتنبؤ من شذوذات SST في المحيط الهادئ المركزي الاستوائي والمحيط الهندي الغربي (الشكل 4c). مع أوقات تقديم أقصر، يقل تأثير SST بينما يزداد تأثير الظروف الأولية الجوية. قد يتسبب الاختلاف في أهمية SST والظروف الأولية في تباين توقعات FuXi-S2S مع زمن التقديم.

اكتشاف إشارات سابقة لتوقع فيضانات باكستان 2022

غالباً ما تفتقر نماذج التوقع المعتمدة على البيانات والتعلم الآلي، مثل FuXi-S2S، إلى دمج صريح للمعرفة السابقة حول النظام الفيزيائي الذي تهدف إلى التنبؤ به. نتيجة لذلك، غالباً ما يُشار إليها باسم “الصناديق السوداء”. على الرغم من أن FuXi-S2S قد أظهر دقة في الأقسام الفرعية السابقة، إلا أن غموض عملياته التنبؤية يمكن أن يقلل من الثقة في موثوقيته. لذلك، من الضروري تفسير FuXi-S2S، مع التأكد من أن تفكيرها الأساسي يتماشى مع الفهم الراسخ لأنظمة الطقس. هنا، قمنا بإنشاء خرائط أهمية لفك تشابك العمليات الرئيسية التي تقود توقع نموذج FuXi-S2S لفيضانات 2022 في باكستان.
في هذه الدراسة، استخدمنا القيم المطلقة السلبية لشذوذ TP، المتوسطة عبر منطقة باكستان (المحددة بالصندوق الأخضر في الشكل 4c)، كدالة خسارة. من خلال تنفيذ الانتشار العكسي لهذه الدالة لحساب التدرجات، حصلنا على خرائط الأهمية. تستخدم هذه الخرائط الألوان الحمراء والزرقاء للدلالة على الارتباطات الإيجابية والسلبية، على التوالي بين السالب لشذوذ TP المعياري و SST. على وجه التحديد، تشير المناطق الزرقاء (الحمراء) إلى أن الانخفاض (الزيادة) في SST مرتبط بزيادة (انخفاض) في السالب لشذوذ TP المعياري، مما يؤدي بالتالي إلى زيادة (انخفاض) في شذوذ TP. ساعد تحليل هذه الخرائط في تحديد إشارات سابقة محتملة ومصادر القابلية للتنبؤ التي ساهمت في حدوث حدث TP الشديد. كما هو موضح في الشكل 4c، تُظهر إشارات SST السابقة، التي تم تحديدها في توقعات تم تهيئتها في تواريخ مختلفة (28 يوليو و21 يوليو 2022)، اتساقاً ملحوظاً. تشير هذه الإشارات إلى تبريد مستمر لـ SST في المحيط الهادئ المركزي الاستوائي والمحيط الهندي الغربي الاستوائي، مع ارتفاع في المحيط الهادئ الشرقي الاستوائي. يتماشى هذا النمط المكاني بشكل وثيق مع النتائج من الدراسات السابقة ، التي حددت التطور السريع لـ La Niña في المحيط الهادئ الاستوائي ومرحلة سلبية من ثنائي القطب في المحيط الهندي في صيف 2022 كإشارات سابقة رئيسية وقوى دافعة لحدث TP الشديد في باكستان. تؤكد نتائجنا أن المهارة التنبؤية العالية لنموذج FuXi-S2S يمكن أن تُعزى إلى قدرته الفعالة على التقاط المصادر القابلة للتنبؤ الرئيسية لهذا الحدث. علاوة على ذلك، تُظهر هذه النتائج إمكانيات النموذج كأداة قيمة لاستكشاف الآليات وراء الأحداث الشديدة بسرعة وكشف الاتصالات عن بُعد داخل أنظمة الأرض، مما يعزز فهمنا الفيزيائي. هنا، نركز على التدرج بالنسبة لـ SST. ومع ذلك، من المهم الاعتراف بوجود
إشارات سابقة أخرى مهمة قد تكون مرتبطة بهذا الحدث الشديد، بما في ذلك ، وشذوذات Z كما هو مذكور في المرجع 73. من المقرر إجراء فحص أكثر شمولاً لهذه العوامل في الأبحاث المستقبلية.

نقاش

في هذه الورقة، قدمنا نموذج FuXi-S2S، وهو نموذج توقع فرعي قائم على التعلم الآلي. يوفر هذا النموذج توقعات عالمية للقيم المتوسطة اليومية لمدة تصل إلى 42 يوماً، مع دقة زمنية يومية و دقة مكانية تشمل خمسة متغيرات جوية علوية عبر 13 مستوى ضغط و11 متغير سطحي. تم تقييم أداء FuXi-S2S بدقة مقابل بيانات إعادة تحليل ERA5 ومقارنتها بتوقعات ECMWF S2S. تم استخدام مجموعة شاملة من المقاييس لهذا التقييم، بما في ذلك المقاييس الحتمية للمتوسط الجماعي، والمقاييس الاحتمالية للتوقع الجماعي، والقدرة على توقع الأحداث الشديدة. أظهرت نتائجنا أن FuXi-S2S يتفوق على ECMWF S2S في دقة التوقع للمتغيرات التي تم تقييمها. علاوة على ذلك، يحسن FuXi-S2S بشكل كبير من الدقة في توقع MJO، موسعاً مهارة توقع MJO من 30 يوماً إلى 36 يوماً. هذه التحسينات مهمة بشكل خاص نظراً لتأثير MJO على أنماط المناخ العالمية، وبالتالي، تحسن دقة توقع النموذج لـ TP) على مستوى العالم. علاوة على ذلك، أظهر FuXi-S2S فائدة في السيناريوهات العملية، مثل أدائه المتفوق في توقع هطول الأمطار الشديدة خلال فيضانات باكستان 2022 في وقت مبكر من نموذج ECMWF S2S. تعتبر هذه القدرة على التنبؤ المبكر حيوية لتحسين الاستعداد والاستجابة للكوارث.
مساهم رئيسي في تفوق FuXi-S2S هو طريقته المبتكرة في توليد الاضطرابات، والتي تعتبر ضرورية لنجاح توقعاته الجماعية. على عكس النماذج التقليدية التي تستخدم اضطرابات عشوائية أو محسوبة بدقة في الظروف الأولية، يدمج FuXi-S2S اضطرابات تعتمد على تدفق الخلفية في ميزاته المخفية. لقد أظهرت هذه الاضطرابات المعتمدة على التدفق أنها تعزز بشكل كبير أداء النموذج في التوقعات الفرعية، كما هو موضح في الشكل التكميلي 1. يميز FuXi-S2S، كنموذج تعلم آلي، نفسه أيضاً بقدرته على توليد توقعات جماعية كبيرة بسرعة وكفاءة، مما يتطلب وقتاً وموارد حسابية أقل بكثير من النماذج التقليدية. على وجه التحديد، يمكنه إكمال توقع شامل لمدة 42 يوماً مع خطوات زمنية يومية في باستخدام وحدة معالجة الرسوميات Nvidia A100 لعضو واحد. حجم المجموعة هو عامل حاسم في مهارة توقع المجموعة. تشير الأبحاث إلى أن العدد الأمثل من الأعضاء للتوقعات الفرعية قد يقع ضمن نطاق 100 إلى 200 عضو . لضمان مقارنة عادلة مع نموذج ECMWF S2S، قمنا حالياً بتقييد نموذج FuXi-S2S إلى مجموعة مكونة من 51 عضواً. ومع ذلك، من المهم ملاحظة أن FuXi-S2S قادر على توليد مجموعات أكبر مع زيادة معتدلة فقط في المتطلبات الحاسوبية. يوضح الشكل التكميلي 15 أن زيادة حجم المجموعة إلى 101 عضواً تعزز أداء توقعات FuXi-S2S مقارنة بمجموعة الـ 51 عضواً.
بصرف النظر عن كفاءته الحسابية ودقته الفائقة، يتفوق نموذج FuXiS2S بشكل ملحوظ في تحديد إشارات السلف وفك تشابك العمليات المعقدة التي تكمن وراء الظروف المناخية المتطرفة، كما يتضح من توقعاته الدقيقة للفيضانات في باكستان عام 2022. تنبع العديد من تحديات التنبؤات الفرعية من الفهم المحدود لهذه العمليات المعقدة. غالبًا ما تعتمد النماذج التقليدية المعتمدة على الفيزياء على تمثيلات مبسطة للغاية للعمليات الفيزيائية، مما يقلل من أداء التنبؤات وعمق التحليل. بالمقابل، يظهر نموذج FuXi-S2S كفاءة في تعلم الأنماط المعقدة وتحديد الاتصالات الدقيقة من كميات هائلة من البيانات. تتناغم هذه المقاربة مع رؤية ألبرت أينشتاين، “لا يمكنك حل مشكلة باستخدام طرق التفكير التي أنشأتها.” في دراستنا لحدث الأمطار المتطرفة في باكستان عام 2022، نوضح أن الانتشار العكسي والخرائط الناتجة عن الأهمية تكشف بنجاح أن نموذج FuXi-S2S يقدم توقعات دقيقة من خلال التقاط العناصر الرئيسية بفعالية
الجدول 1 | ملخص لجميع أسماء المتغيرات الجوية العليا وسطح الأرض واختصاراتها في هذه الورقة
النوع الاسم الكامل الاختصار
المتغيرات الجوية العليا الجهد الجوي Z
درجة الحرارة T
مكون الرياح U
مكون الرياح V
الرطوبة النسبية Q
المتغيرات السطحية درجة حرارة 2 م T2M
درجة حرارة نقطة الندى 2 م D2M
درجة حرارة سطح البحر SST
الإشعاع الطويل الخارج OLR
مكون الرياح u على ارتفاع 10 م U10
مكون الرياح v على ارتفاع 10 م V10
مكون الرياح u على ارتفاع 100 م U100
مكون الرياح v على ارتفاع 100 م V100
ضغط مستوى سطح البحر المتوسط MSL
إجمالي بخار الماء في العمود TCWV
إجمالي الهطول TP
المصادر القابلة للتنبؤ المرتبطة بهذا الحدث. علاوة على ذلك، تساعد مثل هذه الطرق التفسيرية المعتمدة على التدرجات في تفسير توقعات الطقس والمناخ التي تقدمها نماذج التعلم الآلي، مثل نموذج FuXiS2S . لذلك، ندعو إلى تحول في النموذج في تطبيق نماذج التعلم الآلي مثل FuXi-S2S. يجب ألا يمتد التركيز إلى ما هو أبعد من تحسين دقة التنبؤات ليشمل تطوير إطار شامل لاكتشاف العمليات غير المعروفة سابقًا داخل نظام الأرض . نتوقع اعتمادًا متزايدًا على نماذج التعلم الآلي مثل FuXi-S2S داخل المجتمع العلمي، مع الاعتراف بدورها الأساسي في تعزيز الاكتشاف العلمي في علم نظام الأرض.
بينما يقدم نموذج FuXi-S2S بديلاً فعالاً من الناحية الحسابية ودقيقًا لنماذج NWP التقليدية للتنبؤات الفرعية، فإنه يقدم أيضًا فرصًا كبيرة للتحسين. على سبيل المثال، يعمل نموذج ECWMF S2S بدقة مكانية ، والتي هي أدق بكثير من دقة نموذج FuXi-S2S. حاليًا، يتنبأ نموذج FuXi S2S بالقيم المتوسطة اليومية حتى 50 هكتوباسكال ويفتقر إلى معلمات الطقس الحرجة مثل درجات الحرارة القصوى والدنيا اليومية، والتي تعتبر ضرورية لبعض التطبيقات. علاوة على ذلك، نظرًا للاختلافات المعروفة بين بيانات ERA5 TP والملاحظات الفعلية، كما هو مذكور في المراجع 76،77، تم استخدام ملاحظات GPCP لتقييم أداء توقعات TP لكل من ECMWF S2S وFuXiS2S (انظر الشكل التكميلي 16). تشمل التحسينات المتوقعة المستقبلية لنموذج FuXi-S2S زيادة الدقة المكانية من إلى ، وإدخال معلمات طقس إضافية، وتمديد التنبؤ إلى ما بعد الحد الأقصى الحالي البالغ 50 هكتوباسكال، واستخدام مصادر بيانات TP أكثر دقة لتعزيز دقة التنبؤ.

طرق

بيانات

تعتبر ERA5 النسخة الخامسة من مجموعة بيانات إعادة التحليل ECMWF، حيث تقدم مجموعة غنية من المتغيرات السطحية والجوية العليا. تعمل بدقة زمنية ملحوظة تبلغ 1 ساعة ودقة أفقية تبلغ حوالي 31 كم، تغطي البيانات من يناير 1950 حتى اليوم . معترف بها لتغطيتها الزمنية والمكانية الواسعة جنبًا إلى جنب مع دقتها الاستثنائية، تعتبر ERA5 الأرشيف الأكثر شمولاً ودقة لإعادة التحليل على مستوى العالم. في دراستنا، نستخدم إحصائيات يومية مستمدة من مجموعة بيانات ERA5 التي يتم تحديثها كل ساعة، والتي تتمتع بدقة مكانية تبلغ (تتكون من نقاط شبكة خطوط العرض والطول) ودقة زمنية تبلغ 1 يوم. تعتبر المصدر الوحيد للبيانات لتدريب نموذج FuXi-S2S.
تقييم توقعات MJO مقابل مؤشرات MJO المستمدة من بيانات OLR الملاحظة عبر الأقمار الصناعية هو ممارسة شائعة. لذلك، جنبًا إلى جنب مع بيانات إعادة التحليل ERA5، ظهرت مجموعة بيانات OLR جديدة تُدعى مجموعة بيانات OLR لمركز توقعات المناخ (CPC) (CBO). تمتد من 1991 حتى اليوم، وتخضع هذه المجموعة لتحديثات شبه حقيقية. بينما تظهر اختلافات طفيفة في الحجم مقارنةً بمستشعر الإشعاع المتقدم عالي الدقة (AVHRR) التابع للإدارة الوطنية للمحيطات والغلاف الجوي الأمريكية (NOAA)، فإن مجموعة بيانات CBO تُظهر مستوى عالٍ من التشابه في كل من النمط وحجم الشذوذ. في بحثنا، نستخدم بيانات CBO، التي تتمتع بدقة مكانية تبلغ ودقة زمنية تبلغ 1 يوم. تعتبر هذه البيانات الحقيقة الأساسية لـ OLR في تحديد والتحقق من أحداث MJO. علاوة على ذلك، لتقييم هطول الأمطار في منطقة باكستان، يتم الحصول على بيانات هطول الأمطار الملاحظة من مجموعة بيانات GPCP . من الجدير بالذكر أن مؤشرات MJO المستمدة من بيانات OLR ERA5 تتماشى عن كثب مع تلك المستمدة من بيانات OLR CBO.
يتنبأ نموذج FuXi-S2S بإجمالي 76 متغيرًا، تشمل 5 متغيرات جوية عليا عبر 13 مستوى ضغط (50، ، و1000 هكتوباسكال)، و11 متغيرًا سطحيًا. من بين المتغيرات الجوية العليا الجهد الجوي (Z)، درجة الحرارة (T)، مكون الرياح u (U)، مكون الرياح v (V)، والرطوبة النسبية (Q). تشمل المتغيرات السطحية درجة حرارة 2 م (T2M)، درجة حرارة نقطة الندى 2 م (D2M)، درجة حرارة سطح البحر (SST)، OLR، مكون الرياح u على ارتفاع 10 م (U10)، مكون الرياح v على ارتفاع 10 م (V10)، مكون الرياح u على ارتفاع 100 م (U100)، مكون الرياح v على ارتفاع 100 م (V100)، ضغط مستوى سطح البحر المتوسط (MSL)، إجمالي بخار الماء في العمود (TCWV)، وTP. يُعرف OLR بأنه سالب الإشعاع الحراري الصافي العلوي (TTR) وفقًا لاتفاقية ECMWF. يوفر الجدول 1 قائمة شاملة بهذه المتغيرات مع اختصاراتها. تم اختيار المتغيرات مثل U100 وV100 لجدواها المحتملة في توقعات طاقة الرياح. تم اختيار SST بناءً على أبحاث سابقة، والتي تقترح أن المتغيرات التي تتطور ببطء مثل SST ضرورية لتحديد الإشارات القابلة للتنبؤ . تم اختيار OLR بسبب أهميته في تمثيل أحداث MJO من خلال شذوذ OLR.
يعتمد تدريب النموذج على 67 عامًا من البيانات التي تمتد من 1950 إلى 2016، بينما يتضمن التقييم مجموعة بيانات مدتها 5 سنوات من 2017 إلى 2021. يتم استخدام تقنية تطبيع z-score لتطبيع جميع المتغيرات المدخلة والنتائج، مما يضمن التماثل في متوسطها وتباينها. بالنسبة للمتغيرات الجوية العليا، يتم حساب المتوسط والانحراف المعياري بشكل منفصل لمستويات عمودية مختلفة، باستخدام مجموعة بيانات التدريب فقط. بالإضافة إلى ذلك، تخضع مجموعة بيانات عام 2022 للتقييم والمقارنة مع توقعات ECMWF S2S في الوقت الحقيقي، خاصة فيما يتعلق بالفيضانات الكارثية في باكستان. يمكن العثور على تقييمات أكثر تفصيلًا لتوقعات TP وMJO لعام 2022 في المواد التكميلية.
في بعض الحالات، تتلقى التوقعات الفرعية تحديثات منتظمة من خلال تنفيذ النموذج الأحدث، مع دمج الاكتشافات البحثية المخصصة للاستخدام التشغيلي . على سبيل المثال، يتم إنشاء إعادة التنبؤات ECMWF S2S، التي تُعرف غالبًا بالتنبؤات العكسية، بشكل فوري من خلال استخدام أحدث إصدار من النموذج المتاح في وقت إنشاء التنبؤ. في بحثنا، نستخدم إعادة التنبؤات ECMWF S2S التي تم إنشاؤها من دورة النموذج C 47 r 3. تشمل هذه الإعادة تواريخ بدء التهيئة على مدى 20 عامًا، تتراوح من 3 يناير 2002 إلى 29 ديسمبر 2021. يتم تهيئة إعادة التنبؤات ECMWF S2S مرتين أسبوعيًا، بما يتماشى مع التنبؤات في الوقت الحقيقي. بالإضافة إلى ذلك، تتضمن تحليلنا المقارن استخدام التنبؤ ECMWF S2S في الوقت الحقيقي المكون من 51 عضوًا لعام 2022. بالنسبة للتحليل باستخدام بيانات الاختبار من 2017 إلى 2021، يتم تعريف الشذوذ لجميع المتغيرات على أنها انحرافات عن المتوسط المناخي المحسوب على مدى فترة 15 عامًا من 2002 إلى 2016. في حين أنه بالنسبة للتحليل القائم على بيانات الاختبار في عام 2022، يتم حساب المتوسط المناخي على مدى الفترة من 2002 إلى 2021. علاوة على ذلك، يتم إنشاء مجموعة من التنبؤات العكسية من 2002 إلى 2016 لـ FuXi-S2S، والتي تُستخدم لإنشاء
مرحلة استنتاج FuXi-S2S
مرحلة تدريب FuXi-S2S
الشكل 5 | مخطط هيكلي لهياكل نموذج فوكسي للفترة بين الموسمية إلى الموسمية (FuXi-S2S). أ مرحلة الاستدلال لنموذج فوكسي-S2S. يمثل الميزة المخفية التي تم إنشاؤها بواسطة المشفر من بيانات الإدخال. متجه الاضطراب يتم توليده بواسطة وحدة الاضطراب، مما يؤدي إلى الاضطراب
ميزة مخفية . مرحلة تدريب نموذج FuXi-S2S. و هي التوزيعات الغاوسية متعددة المتغيرات ذات الرتبة المنخفضة التي تم إنشاؤها بواسطة المشفرين P و Q، على التوالي. تقيس خسارة تباين كولباك-ليبلر (KL) الفجوة بين التوزيعات التي يتنبأ بها كلا المشفرين، و .
علم المناخ. يتم بعد ذلك طرح هذا العلم المناخي من توقعات FuXi-S2S لبيانات الاختبار التي تمتد من 2017 إلى 2021. تسهل هذه العملية حساب شذوذات FuXi-S2S للتقييمات.
لضمان مقارنات عادلة، نقوم بتقييم توقعات FuXi-S2S بشكل خاص في تواريخ التهيئة المتطابقة التي تتوافق مع تلك المستخدمة لكل من إعادة توقعات ECMWF S2S والتوقعات. تسهل هذه الطريقة تقييمًا عادلًا ومباشرًا بين FuXi-S2S وECMWF S2S.

نموذج FuXi-S2S

تستند معظم نماذج التعلم الآلي المتطورة المستخدمة في توقعات الطقس متوسطة المدى إلى نموذج الترميز-فك الترميز. الهندسات . تُفضل هذه الهياكل بسبب كفاءتها في معالجة وتوليد البيانات التسلسلية والمكانية. ضمن هذه المعماريات، يقوم المشفر بمعالجة الميزات الرئيسية من بيانات الإدخال وتحويلها إلى تمثيل مضغوط ومجرد في الفضاء الكامن. ثم يستخدم المفكك هذا التمثيل لتوليد توقعات الطقس. الهدف الرئيسي من تدريب هذه النماذج هو تقليل الفروق بين مخرجات النموذج والبيانات المستهدفة. ومع ذلك، فإن الهياكل القياسية للمشفر-المفكك هي بطبيعتها حتمية، مما ينتج عنه توقعات متطابقة لنفس المدخلات، مما يحد من قابليتها للتطبيق في توليد توقعات جماعية. للتغلب على هذه القيود، نقدم نموذج FuXi-S2S، مستلهمين من المشفرات التلقائية المتغيرة (VAEs) تعتبر نماذج VAE بطبيعتها احتمالية، مما يجعلها مناسبة تمامًا للمهام التي تتطلب قياس عدم اليقين. مثل نماذج VAE، لا يقوم مشفر نموذج FuXiS2S ببساطة بإنشاء ميزة خفية ثابتة من بيانات الإدخال. بدلاً من ذلك، يقوم بتحويل بيانات الإدخال إلى توزيع غاوسي في الفضاء الكامن، والذي يلتقط الخصائص الاحتمالية للبيانات، بالإضافة إلى ميزة خفية ثابتة. ثم يقوم المفكك بدمج عينات من التوزيع الغاوسي مع الميزة الخفية الثابتة لتوليد التوقعات. هذه المنهجية
تلتقط بشكل فعال عدم اليقين الكامن في البيانات، مما يمكّن من توليد توقعات جماعية تحت ظروف إدخال متطابقة من خلال أخذ عينات متكررة من التوزيع الغاوسي. لفهم أفضل، نقوم برسم تشبيهات بين تقنيات التعلم الآلي والمصطلحات التقليدية في التنبؤات الجوية/التنبؤات الفرعية. في نموذجنا، تشكل الميزة الخفية الثابتة أساسًا للتوقعات الحتمية، بينما يعمل أخذ العينات من التوزيع الغاوسي كوحدة اضطراب. هذه الوحدة تُدخل اضطرابات تعتمد على التدفق في الميزة الخفية للنموذج، مما يسهل توليد التوقعات الجماعية.
يتكون نموذج FuXi-S2S، الموضح في الشكل 5a، من ثلاثة مكونات رئيسية: مشفر P، وحدة الاضطراب، ومفكك الشفرة. يقوم المشفر بمعالجة معلمات الطقس المتوقعة من خطوتين زمنيتين سابقتين، حيث تمثل كل خطوة زمنية 1 يوم، حيث تم تصميم FuXiS2S للتنبؤ بالقيم المتوسطة اليومية. على وجه التحديد، يأخذ و كمدخلات إلى طبقة تلافيف ثنائية الأبعاد (2D) بحجم نواة يبلغ اثنين، مما يقلل أبعاد بيانات الإدخال إلى النصف. بعد ذلك، الميزة المخفية (بأبعاد ) مستمد من 12 كتلة محول متكررة. المدخل إلى المشفر هو مكعب بيانات يجمع بين متغيرات الهواء العلوي والسطحي، بأبعاد . تمثل هذه الأبعاد خطوتين زمنيتين سابقتين ( و )، عدد متغيرات الإدخال، ونقاط الشبكة من خط العرض ( H ) وخط الطول ( W )، على التوالي. لأخذ تراكم خطأ التنبؤ على مر الزمن في الاعتبار، فإن فترة التنبؤ ( ) مدرج أيضًا في مدخل المشفر. بالإضافة إلى ، يقوم المشفر أيضًا بإنشاء توزيع غاوسي متعدد المتغيرات منخفض الرتبة، ، يتميز بمتجه متوسط مصفوفة التغاير ومصفوفة تغاير قطرية diag . متجهات الاضطراب المتوسطة ( البعد: ) يتم أخذ عينات منها من هذا التوزيع الغاوسي ( ). هذه المتجهات، بعد أن يتم وزنها بواسطة متجه الوزن المتعلم، تعطي المتجهات النهائية للاختلال z (البعد: ).
ثم يقوم جهاز فك التشفير بمعالجة الميزات المخفية المتغيرة من خلال 24 كتلة محول وطبقة متصلة بالكامل، مما يؤدي إلى الناتج النهائي للتجميع عدد أعضاء المجموعة المولدة يساوي عدد العينات المأخوذة من التوزيع الغاوسي .
يركز تدريب نموذج FuXi-S2S بشكل أساسي على بناء توزيع غاوسي يمثل بدقة عدم اليقين في توقعات النموذج. تتمثل إحدى التحديات الكبيرة في هذه العملية في انحراف التوزيع الغاوسي المستمد من توقعات النموذج عن التوزيع الغاوسي المستند إلى البيانات المستهدفة، والذي يُعزى إلى حد كبير إلى أخطاء التوقع. يتم معالجة هذه التحدي من خلال تقطير المعرفة، الذي يمكّن من نقل المعلومات من التوزيعات الواقعية إلى تلك التي يتنبأ بها النموذج. ضمن هذا الإطار، يلعب المشفر Q دورًا حاسمًا، حيث يقوم بتحويل البيانات المستهدفة إلى توزيع غاوسي. يعمل هذا التوزيع كمشرف على التوزيع الذي ينتجه المشفر P، بهدف محاذاة كلا التوزيعين عن كثب من خلال تقليل خسارة تباين كولباك-ليبلر (KL). ). تقيس خسارة KL هذه التباين بين التوزيعات التي تتنبأ بها كل من المشفرين. كما هو موضح في الشكل 5b، خلال مرحلة تدريب نموذج FuXi-S2S، يقوم المشفر Q، الذي يشارك هيكل الشبكة مع المشفر P، بمعالجة مكعب بيانات يحتوي على معلمات الطقس المستهدفة من الخطوات الزمنية السابقة والحالية: و . يتنبأ بتوزيع غاوسي متعدد المتغيرات منخفض الرتبة مماثل للترميز P. يتم أخذ عينات من متجهات الاضطراب الوسيطة من توزيع الترميز Q. ) أثناء التدريب (انظر الشكل 5ب)، ومن توزيع المشفر P’s ( ) أثناء الاختبار (انظر الشكل 5أ). هذه المتجهات لها أبعاد . بالإضافة إلى ذلك، يتم حساب خسارة L1 بين مخرجات النموذج ( ) والهدف لذلك، يتم تحديد دالة الخسارة العامة في كل خطوة من خطوات الانحدار الذاتي بواسطة المعادلة التالية:
أين معامل قابل للتعديل يوازن و L 1 ، تم تعيينه إلى في هذه الدراسة. تصميم دالة الخسارة هذه يخدم غرضين: المصطلح الأول يضمن أن يكون متجه الاضطراب قريبًا من توزيع البيانات الحقيقي، بينما يضمن المصطلح الثاني أن تكون التنبؤات غير متأثرة بأي متجهات اضطراب. .
في هذه الدراسة، نستخدم 51 عضوًا في المجموعة للتنبؤات الموسمية الفرعية. كما هو موضح في الشكل التكميلي 15، يظهر نموذج FuXiS2S، عند تحسينه باضطرابات تعتمد على التدفق المدمجة في ميزاته المخفية، أداءً محسّنًا بشكل ملحوظ في التنبؤ مقارنةً بنموذج FuXi-S2S الذي يجمع بين ضوضاء بيرلين في الظروف الأولية مع اضطرابات ثابتة مضافة إلى الميزات المخفية. ومن الجدير بالذكر أن إضافة ضوضاء بيرلين تؤدي إلى تحسينات هامشية فقط في دقة التنبؤ عندما تكون حجم المجموعة صغيرًا. ومع ذلك، مع أحجام مجموعات أكبر، مثل 51 عضوًا في هذه الدراسة، فإن إضافة ضوضاء بيرلين لا تعزز دقة التنبؤ.
مماثل لـ FuXi، نحن نستخدم دالة خسارة متعددة الخطوات تعتمد على الانحدار الذاتي للتخفيف من الأخطاء التراكمية على مدى فترات زمنية طويلة، كما هو موضح في لام وآخرون. تتبع عملية التدريب نظام تدريب تلقائي الانحدار وجدول تدريب منهجي، حيث يتم زيادة عدد خطوات الانحدار التلقائي تدريجياً من 1 إلى 17. تخضع كل خطوة انحدار تلقائي لـ 1000 تحديث باستخدام الانحدار التدرجي، مما يؤدي إلى إجمالي عدد 17,000 خطوة تدريب. تستخدم عملية التدريب 8 وحدات معالجة الرسوميات Nvidia A100، حيث يتم استخدام حجم دفعة قدره 1. يتم تنفيذ التحسين باستخدام AdamW. المحسّن مع المعلمات التالية: و معدل التعلم الأولي لـ ومعامل انحدار الوزن 0.1. يتم تلخيص معلمات التحسين المستخدمة في التدريب في الجدول التكميلي 1.

خريطة البروز

أدت التطورات الأخيرة في مجال XML إلى ظهور تقنيات متنوعة بما في ذلك رسم الخرائط البارزة. يقوم رسم الخرائط البارزة بت quantifying تأثير مدخلات النموذج على مخرجاته. تتميز هذه الطريقة بكثافات التدرج داخل خرائط البروز؛ حيث تعتبر المناطق ذات التدرجات الأعلى حاسمة من قبل النموذج لإجراء توقعات دقيقة.
توليد خرائط البروز يعتمد بشكل أساسي على الانتشار العكسي. وهذا يختلف عن تدريب النموذج القياسي حيث يمكن تعديل هدف الانتشار اعتمادًا على الهدف المحدد للتحليل. هنا، يتم إعطاء بروز الشذوذ المتوقع بالنسبة لبيانات الإدخال بواسطة:
أين تشير إلى نموذج FuXi-S2S و هو عدد الخطوات الأمامية، بينما و هي المتوسط المناخي والانحراف المعياري، على التوالي. D تحدد المنطقة الجغرافية المعنية. و تمثل متغيرات الإدخال والإخراج. من المتوقع أن ينتج نموذج مدرب بشكل جيد خريطة تمييز تتماشى بشكل جيد مع الفهم الفيزيائي المعتمد لأنظمة الطقس. في دراستنا، نقوم بإنشاء خريطة تمييز مجمعة من خلال متوسط الخرائط الفردية التي تم إنشاؤها من كل من الأعضاء الـ 51 في المجموعة.

طريقة التقييم

قبل التقييم، يخضع كل متغير في توقعات الـ 42 يومًا لعملية إزالة الاتجاه لإزالة الاتجاه الخطي. هذه الخطوة ضرورية لإزالة الاتجاهات الخطية طويلة الأجل التي قد تتأثر بالاحترار العالمي. لإزالة الاتجاه، يتم ملاءمة نموذج الانحدار الخطي لتقدير الاتجاه الخطي الأسبوعي المتوسط من كل من التوقعات والملاحظات خلال فترة التنبؤ العكسي (2002-2016). خلال فترة الاختبار (2017-2021)، يأخذ هذا النموذج أسبوع السنة كبيانات إدخال لحساب الاتجاه، والذي يتم طرحه بعد ذلك من كل من التوقعات والملاحظات للحصول على الحقول التي تم إزالة الاتجاه منها. بعد ذلك، يتم تقييم المقاييس الحتمية لمتوسط المجموعة باستخدام TCC الموزون حسب خط العرض، والذي يتم حسابه على النحو التالي:
أين يمثل وقت بدء التوقع في مجموعة بيانات الاختبار ، و تشير إلى عدد نقاط الشبكة في اتجاهات العرض والطول. المؤشرات ، و تتوافق مع المتغيرات، وخطوط العرض، وخطوط الطول، على التوالي. يشير إلى خطوات زمن التنبؤ المضافة إلى و هي الفروقات بين التوقعات أو الملاحظات والمتوسط المناخي، حيث يتم اشتقاق المتوسط المناخي من بيانات تمتد من عام 2002 إلى عام 2016.
لتقييم أداء توقعات المجموعة، نستخدم RPSS الذي يقيس المقارنة بين الأخطاء التراكمية المربعة للاحتمالات لتوقع معين وتوقع مناخي. يتطلب حساب مقياس RPSS تحديدًا مسبقًا لدرجات الاحتمالات المرتبة (RPS) لكل من التوقع (RPS ) وتوقعات المناخ ( RPS يجب حساب ) أولاً. يقوم RPS بتجميع أخطاء الاحتمالات المربعة عبر ( في هذا العمل) الفئات، مثل الثلث، مرتبة بترتيب تصاعدي. يتم تحديد حدود الثلث بناءً على القيم المتوسطة على مدى فترات تتراوح بين أسبوع واحد أو أسبوعين لكل فترة تحقق مقابلة. يتم إجراء هذه الحسابات لحدود الثلث
بشكل منفصل لكل نموذج توقع وملاحظة (بيانات ERA5). يقيم المقياس دقة توقع الاحتمالية في التنبؤ بفئة الملاحظة الفعلية. يتم اشتقاق درجة RPS من مجموع الفروق المربعة بين احتمال التوقع الفئوي التراكمي ونظيره الملاحظ، حيث تشير إلى الفئة الملاحظة و يمثل فئات أخرى:
أين تمثل مكونات التوقع التراكمي، والتوزيعات المناخية، والتوزيعات الملاحظة، على التوالي. و ، “ تتوافق مع الاحتمالية المتوقعة، المناخية، والملاحظة لحدوث الحدث في الفئة من المهم أن يتأثر RPS بكل من احتمالات التوقع المنسوبة إلى الفئة الملاحظة والاحتمالات المعينة للفئات الأخرى. تتراوح قيمة RPS بين 0 و 1، حيث تشير القيمة الأقل إلى خطأ أقل في احتمالات التوقع، وبالتالي توقع أكثر دقة. على وجه التحديد، تشير قيمة RPS التي تساوي 0 إلى توقع فئوي دقيق تمامًا. باستخدام قيم RPS لكل من التوقع والتوقع المناخي، يمكن تحديد RPSS على النحو التالي:
حيث تشير الأقواس <…> إلى متوسط RPS و RPS القيم عبر جميع أزواج التوقعات والملاحظات. نظرًا لأن كل فئة من فئات التوقعات متساوية الاحتمال حسب التصميم، فإن التوقع المناخي يفترض احتمال حدوث بنسبة 33% لكل فئة. وتعتبر مقياس RPSS مقياسًا مقارنًا ضد التوقع المناخي. تتراوح قيمته من إلى 1، حيث 1 يتوافق مع توقع مثالي والقيم الأعلى تشير إلى أداء أفضل في التوقع. تشير قيمة RPSS الإيجابية إلى دقة متفوقة مقارنة بالتوقع المناخي، بينما تشير القيمة السلبية إلى دقة أقل. تشير القيمة صفر إلى أن التوقع ليس له مهارة إضافية مقارنة بالتوقع المناخي.
بالإضافة إلى ذلك، نستخدم نظام BSS لتقييم أداء التوقعات المتطرفة. يُعتبر BSS، وهو مقياس مستخدم على نطاق واسع لتقييم جودة التوقعات الاحتمالية الفئوية، حالة خاصة من RPSS مع فئتين من التوقعات. يتم حساب BSS باستخدام المعادلة التالية:
أين و تمثل درجات بريير (BS) لنموذج التنبؤ وتنبؤ المناخ، على التوالي. مشابهًا لمؤشر RPS، يقيس مؤشر BS الفرق التربيعي المتوسط بين الاحتمالات المتوقعة والملاحظات (إما 0 أو 1) في التنبؤات الاحتمالية الثنائية. في هذه الدراسة، يتم حساب BSS لمتوسط المجموعة لكل من FuXi-S2S و ECMWF S2S، باستخدام النسب المئوية المناخية في المئة التسعين كعتبة للأحداث المتطرفة. يتراوح BS من 0 إلى 1، حيث تشير القيم المنخفضة إلى توافق أفضل بين التنبؤات الجماعية والملاحظات، مع 0 تشير إلى أفضل نتيجة ممكنة لمؤشر BS. على العكس، يشير BSS الأعلى، حتى حد أقصى قدره 1، إلى أداء أفضل. يقيس BSS تحسين BS للتنبؤ. ) بالنسبة لتوقعات المناخ ( ) كمرجع. يشير BSS بقيمة واحد إلى توقع مثالي، بينما تشير القيمة صفر إلى عدم وجود تحسين مقارنة بـ
علم المناخ، والقيم السلبية تشير إلى أداء أقل مقارنة بعلم المناخ.
عادةً ما يتم وصف تطور MJO باستخدام مؤشر MJO المتعدد المتغيرات في الوقت الحقيقي (RMM)، كما تم تطويره في الأصل بواسطة ويلر وهيندون. تمثل مؤشرات RMM1 و RMM2 المكونين الرئيسيين الأول والثاني من EOF المدمج. يتم اشتقاق هذا EOF بناءً على القيم المتوسطة اليومية لـ OLR، والرياح الأفقية عند 850 هكتوباسكال (U850)، والرياح الأفقية عند 200 هكتوباسكال (U200)، جميعها متوسطة ضمن نطاق خطوط العرض من و في هذه الدراسة، نستخدم المكونات الأساسية المستمدة من ويلر وهيندون (2004) للحصول على مؤشرات MJO المتوقعة، يتم أولاً استيفاء بيانات كل من نماذج FuXi-S2S و ECMWF S2S من دقة مكانية ، وتم إسقاطها على الأنماط الأساسية الملاحظة. بعد حساب متوسط الشذوذ الجماعي، تم اشتقاق RMM لمتوسط الجماعة لكلا النمطين. يتم تعريف السعة والطور لـ MJO على التوالي بواسطة الصيغ: RMMA = و لتقييم جودة توقعات MJO، نقوم بحساب معامل الارتباط الثنائي باستخدام المعادلة التالية:
أين و هي RMM1 و RMM2 الملحوظة في الوقت مستمدة من مجموعة بيانات إعادة التحليل ERA5. وبناءً عليه، و تمثل التوقعات للوقت مع فترة زمنية مسبقة من أيام، على التوالي. يمثل عدد التوقعات الإجمالية. نحن نطبق عتبة COR للتنبؤ الماهر .
بالإضافة إلى ذلك، قمنا بتقييم المساهمات النسبية للسعة والطور في مهارات التنبؤ لـ MJO من خلال فحص معامل الارتباط ومقاييس الخطأ لتوقعات المتوسط الجماعي لكل مكون. كان معامل الارتباط للسعة ( ) ومرحلة ( ) تم حسابها باستخدام الطرق الموضحة من قبل وانغ وآخرون. كما يلي:
أين و تمثل السعات الملحوظة والمتوقعة لـ MJO، على التوالي، بينما و تشير إلى المراحل الملاحظة والمتوقعة. بالإضافة إلى ذلك، قمنا بحساب متوسط أخطاء السعة والطور (ERROR وخطأ ) كما يلي، استنادًا إلى الطريقة الموضحة من قبل راشد وآخرون. :
تُعرض تفاصيل إضافية حول COR وERROR للسعة والطور في الشكل التكميلية 9.
تظهر قابلية التنبؤ الجوي تباينًا كبيرًا من يوم لآخر، مما يؤثر بدوره على الدقة المحتملة لتوقعات الطقس. لتحديد ما إذا كانت FuXi-S2S تتفوق باستمرار على ECMWF S2S على الرغم من هذا التباين، اعتمدنا نهجًا يعتمد على إعادة التقدير لاختبار الدلالة. تتضمن هذه الطريقة إنشاء عدد كبير من مجموعات البيانات الاصطناعية، على سبيل المثال، 1000 في هذا العمل. لكل يوم ضمن هذه المجموعات، يتم اختيار توقع عشوائيًا من إما النموذج A أو النموذج B. ثم يتم تقييم مهارة التوقع لكل مجموعة بيانات اصطناعية.
من خلال مقارنتها بالملاحظة الفعلية. إذا كانت أداء النموذج A يتجاوز النسبة المئوية 97.5 من توزيع المهارة المستمد من مجموعات البيانات الاصطناعية، يمكن اعتباره “أفضل بشكل ملحوظ” من النموذج B. على العكس، إذا كان أداؤه يقع تحت النسبة المئوية 2.5، يُعتبر “أسوأ بشكل ملحوظ”. كما قمنا بتحليل الأماكن التي يكون فيها نموذج FuXiS2S ونموذج ECMWF S2S أفضل أو أسوأ بشكل ملحوظ من التوقعات المناخية، حيث يمثل النموذج B هذه التوقعات. على مدار الورقة، تم تطبيق اختبار الدلالة على جميع الرسوم البيانية الشريطية والخرائط المكانية لمقاييس الإحصاء. بالنسبة لجميع الرسوم البيانية الشريطية في الورقة، تم استخدام لون باهت عندما لا يظهر نموذج FuXi-S2S تحسنًا ذا دلالة إحصائية مقارنة بنموذج ECMWF S2S. بالإضافة إلى ذلك، قمنا بتحديد المناطق على جميع الخرائط المكانية حيث تكون درجة المهارة ذات دلالة إحصائية باستخدام النقاط المتقطعة.

توفر البيانات

قمنا بتنزيل مجموعة فرعية من الإحصائيات اليومية من بيانات ERA5 الساعية من الموقع الرسمي لبيانات مناخ كوبرنيكوس (CDS) فيhttps://cds.climate.copernicus.eu/cdsapp#!/software/app-c3s-daily-era5-statisticsتم الحصول على بيانات ECMWF S2S منhttps://apps. ecmwf.int/datasets/data/s2s/. الـ تُقدم بيانات CPC OLR من قبل مختبر العلوم الفيزيائية التابع للإدارة الوطنية للمحيطات والغلاف الجوي (NOAA) من موقعهم الإلكتروني https:// psl.noaa.govتم الحصول على بيانات هطول الأمطار من مشروع المناخ العالمي لهطول الأمطار (GPCP) من الإدارة الوطنية للمحيطات والغلاف الجوي (NOAA)، وتحديداً من المراكز الوطنية لمعلومات البيئة (NCEI)، والتي يمكن الوصول إليها علىhttps://www. ncei.noaa.gov/products/global-precipitation-climatology-projectتم توفير البيانات ذات الصلة من كل شكل في المخطوطة الرئيسية وفي المعلومات التكميلية فيhttps://zenodo.org/السجلات/12662702 .

توفر الشيفرة

شفرة المصدر المستخدمة لتدريب وتشغيل نماذج FuXi-S2S في هذا البحث متاحة ضمن مجلد محدد على Google Drive (https:// drive.google.com/drive/folders/1z47CRQdKFZaOjtKQWSNZobC1_RePUVIK?usp=sharing) . حيث إن نموذج FuXi-S2S والرمز هما موارد أساسية لهذه الدراسة. حاليًا، الوصول إلى هذه الموارد محدود. للاستفسارات والوصول إلى رابط Google Drive، يرجى التواصل مع لي هاو على عنوان البريد الإلكتروني التالي: lihao_lh@fudan.edu.cnيستند حساب مؤشر MJO على القيم الذاتية المستمدة من ويلر وهيندون. تنفيذ ضوضاء بيرلين يعتمد على ما هو متاح للجمهور من مستودع جيثب:https://github.com/pvigier/بيرلين-نومباي.

References

  1. National Academies of Sciences. Next generation earth system prediction: strategies for subseasonal to seasonal forecasts (National Academies Press, Washington, DC, 2016).
  2. White, C. J. et al. Potential applications of subseasonal-to-seasonal (s2s) predictions. Meteorol Appl. 24, 315-325 (2017).
  3. Pegion, K. et al. The subseasonal experiment (subx): a multimodel subseasonal prediction experiment. Bull. Am. Meteorol Soc. 100, 2043-2060 (2019).
  4. White, C. J. et al. Advances in the application and utility of subseasonal-to-seasonal predictions. Bull. Am. Meteorol Soc. 103, E1448-E1472 (2022).
  5. Domeisen, D. I. et al. Advances in the subseasonal prediction of extreme events: relevant case studies across the globe. Bull. Am. Meteorol Soc. 103, E1473-E1501 (2022).
  6. Lorenz, E. N. Forced and free variations of weather and climate. J. Atmos. Sci. 36, 1367 – 1376 (1979).
  7. Mariotti, A., Ruti, P. M. & Rixen, M. Progress in subseasonal to seasonal prediction through a joint weather and climate community effort. NPJ Clim. Atmos. Sci. 1, 4 (2018).
  8. Weyn, J. A., Durran, D. R., Caruana, R. & Cresswell-Clay, N. Subseasonal forecasting with a large ensemble of deep-learning
    weather prediction models. J. Adv. Model. Earth Syst. 13, e2021MSOO2502 (2021).
  9. Han, J.-Y., Kim, S.-W., Park, C.-H. & Son, S.-W. Ensemble size versus bias correction effects in subseasonal-to-seasonal (s2s) forecasts. Geosci. Lett. 10, 37 (2023).
  10. Vitart, F. Evolution of ECMWF sub-seasonal forecast skill scores. Q. J. R. Meteorol Soc. 140, 1889-1899 (2014).
  11. Saha, S. et al. The NCEP climate forecast system version 2. J. Clim. 27, 2185-2208 (2014).
  12. Vitart, F. et al. The subseasonal to seasonal (s2s) prediction project database. Bull. Am. Meteorol Soc. 98, 163-173 (2017).
  13. Nowak, K., Webb, R., Cifelli, R. & Brekke, L. Sub-seasonal climate forecast rodeo. In Proc. 2017 AGU Fall Meeting, 11-15 (New Orleans, LA, 2017).
  14. Monhart, S. et al. Skill of subseasonal forecasts in Europe: Effect of bias correction and downscaling using surface observations. J. Geophys. Res. Atmos. 123, 7999-8016 (2018).
  15. Hwang, J., Orenstein, P., Cohen, J., Pfeiffer, K. & Mackey, L. Improving subseasonal forecasting in the western us with machine learning. In Proc. of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2325-2335 (2019).
  16. Vitart, F. et al. Outcomes of the WMO prize challenge to improve subseasonal to seasonal predictions using artificial intelligence. Bull. Am. Meteorol Soc. 103, E2878-E2886 (2022).
  17. Mouatadid, S. et al. Adaptive bias correction for improved subseasonal forecasting. Nat. Commun. 14, 3482 (2023).
  18. Domeisen, D. I. et al. Advances in the subseasonal prediction of extreme events: relevant case studies across the globe. Bull. Am. Meteorol Soc. 103, 1473-1501 (2022).
  19. Demaeyer, J., Penny, S. G. & Vannitsem, S. Identifying efficient ensemble perturbations for initializing subseasonal-to-seasonal prediction. J. Adv. Model. Earth Syst. 14, 1-30 (2022).
  20. Buizza, R., Milleer, M. & Palmer, T. N. Stochastic representation of model uncertainties in the ECMWF ensemble prediction system. Q. J. R. Meteorol Soc. 125, 2887-2908 (1999).
  21. Buizza, R. Introduction to the special issue on ” 25 years of ensemble forecasting”. Q. J. R. Meteorol Soc. 145, 1-11 (2019).
  22. Leutbecher, M. Ensemble size: How suboptimal is less than infinity? Q. J. R. Meteorol Soc. 145, 107-128 (2019).
  23. Cohen, J. et al. S2s reboot: an argument for greater inclusion of machine learning in subseasonal to seasonal forecasts. Wiley Interdiscip. Rev. Clim. Change 10, e00567 (2019).
  24. Richardson, D. S. Measures of skill and value of ensemble prediction systems, their interrelationship and the effect of ensemble size. Q. J. R. Meteorol Soc. 127, 2473-2489 (2001).
  25. Hu, Y., Chen, L., Wang, Z. & Li, H. SwinVRNN: A data-driven ensemble forecasting model via learned distribution perturbation. J. Adv. Model. Earth Syst. 15, e2022MS003211 (2023).
  26. Kurth, T. et al. FourCastNet: Accelerating Global High-Resolution Weather Forecasting Using Adaptive Fourier Neural Operators. In Proc. of the Platform for Advanced Scientific Computing Conference (2022).
  27. Lam, R. et al. Learning skillful medium-range global weather forecasting. Science 382, eadi2336 (2023).
  28. Bi, K. et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533-538 (2023).
  29. Chen, L. et al. Fuxi: a cascade machine learning forecasting system for 15-day global weather forecast. Npj Clim. Atmos. Sci. 6, 1-11 (2023).
  30. Zhong, X. et al. Fuxi-extreme: improving extreme rainfall and wind forecasts with diffusion model (2023).
  31. Nguyen, T. et al. Scaling transformer neural networks for skillful and reliable medium-range weather forecasting. Preprint at https:// arxiv.org/abs/2312.03876 (2023).
  32. Haiden, T. et al. Evaluation of ECMWF forecasts, including the 2021 upgrade. ECMWF Technical Memorandum No. 884 (European Centre for Medium-Range Weather Forecasts, 2021). https://doi. org/10.21957/90pgicjk4.
  33. Wang, C. et al. Coupled ocean-atmosphere dynamics in a machine learning earth system model. Preprint at https://arxiv.org/abs/ 2406.08632 (2024).
  34. He, S., Li, X., DelSole, T., Ravikumar, P. & Banerjee, A. Sub-seasonal climate forecasting via machine learning: challenges, analysis, and advances. Proc. AAAI Conf. Artif. Intell. 35, 169-177 (2021).
  35. Kiefer, S. M., Lerch, S., Ludwig, P. & Pinto, J. G. Can machine learning models be a suitable tool for predicting central European cold winter weather on subseasonal to seasonal time scales? Artif. Intell. Earth Syst. 2, 1-16 (2023).
  36. Molteni, F., Buizza, R., Palmer, T. N. & Petroliagis, T. The ECMWF ensemble prediction system: Methodology and validation. Q. J. R. Meteorol Soc. 122, 73-119 (1996).
  37. de Andrade, F., Coelho, C. A. & Cavalcanti, I. F. Global precipitation hindcast quality assessment of the subseasonal to seasonal (s2s) prediction project models. Clim. Dyn. 52, 5451-5475 (2019).
  38. Madden, R. A. & Julian, P. R. Detection of a 40-50 day oscillation in the zonal wind in the tropical pacific. J. Atmos. Sci. 28, 702-708 (1971).
  39. Madden, R. A. & Julian, P. R. Description of global-scale circulation cells in the tropics with a 40-50 day period. J. Atmos. Sci. 29, 1109-1123 (1972).
  40. Bach, S. et al. On pixel-wise explanations for non-linear classifier decisions by layer-wise relevance propagation. PLoS ONE 10, e0130140 (2015).
  41. McGovern, A. et al. Making the black box more transparent: understanding the physical implications of machine learning. Bull. Am. Meteorol Soc. 100, 2175-2199 (2019).
  42. Molnar, C., Casalicchio, G. & Bischl, B. Interpretable machine learning-a brief history, state-of-the-art and challenges. In Proc. Joint European conference on machine learning and knowledge discovery in databases, 417-431 (Springer, 2020).
  43. Mamalakis, A., Ebert-Uphoff, I. & Barnes, E. A. Explainable artificial intelligence in meteorology and climate science: Model fine-tuning, calibrating trust and learning new science. In Proc. International Workshop on Extending Explainable AI Beyond Deep Models and Classifiers, 315-339 (Springer, 2020).
  44. Toms, B. A., Kashinath, K. & Yang, D. et al. Testing the reliability of interpretable neural networks in geoscience using the Madden-Julian oscillation. Geosci. Model Dev. 14, 4495-4508 (2021).
  45. Rasp, S. & Thuerey, N. Data-driven medium-range weather prediction with a Resnet pretrained on climate simulations: a new model for Weatherbench. J. Adv. Model. Earth Syst. 13, e2020MS002405 (2021).
  46. Simonyan, K., Vedaldi, A. & Zisserman, A. Deep inside convolutional networks: Visualising image classification models and saliency maps. In Proc. International Conference on Learning Representations (2013).
  47. Dunstone, N. et al. Windows of opportunity for predicting seasonal climate extremes highlighted by the Pakistan floods of 2022. Nat. Commun. 14, 6544 (2023).
  48. Faghmous, J. H. & Kumar, V. A big data guide to understanding climate change: the case for theory-guided data science. Big Data 2, 155-163 (2014).
  49. Karpatne, A. et al. Theory-guided data science: a new paradigm for scientific discovery from data. IEEE Trans. Knowl. Data Eng. 29, 2318-2331 (2017).
  50. Chattopadhyay, A. & Hassanzadeh, P. Long-term instability of deep learning-based digital twins of the climate system: Cause and solution. In Proc. APS March Meeting Abstracts (2023).
  51. Epstein, E. S. A scoring system for probability forecasts of ranked categories. J. Appl. Meteorol 8, 985-987 (1969).
  52. Wilks, D. S. Statistical methods in the atmospheric sciences 3rd edn, Vol. 100 (2011).
  53. Vitart, F. & Robertson, A. W. The sub-seasonal to seasonal prediction project (s2s) and the prediction of extreme events. NPJ Clim. Atmos. Sci. 1, 3 (2018).
  54. Merryfield, W. J. et al. Current and emerging developments in subseasonal to decadal prediction. Bull. Am. Meteorol Soc. 101, E869-E896 (2020).
  55. Zhang, C. Madden-Julian oscillation. Rev. Geophys. 43 (2005).
  56. Zhang, C. Madden-Julian oscillation: bridging weather and climate. Bull. Am. Meteorol Soc. 94, 1849-1870 (2013).
  57. Zhang, C. et al. Cracking the MJO nut. Geophys. Res. Lett. 40, 1223-1230 (2013).
  58. Neena, J. et al. Predictability of the Madden-Julian oscillation in the intraseasonal variability hindcast experiment (ISVHE). J. Clim. 27, 4531-4543 (2014).
  59. Kim, H., Vitart, F. & Waliser, D. E. Prediction of the Madden-Julian oscillation: a review. J. Clim. 31, 9425-9443 (2018).
  60. Jiang, X. et al. Fifty years of research on the madden-julian oscillation: Recent progress, challenges, and perspectives. J. Geophys. Res. Atmos. 125, e2019JDO30911 (2020).
  61. Wu, J. & Jin, F.-F. Improving the MJO forecast of s2s operation models by correcting their biases in linear dynamics. Geophys. Res. Lett. 48, 1-10 (2021).
  62. Silini, R. et al. Improving the prediction of the Madden-Julian oscillation of the ECMWF model by post-processing. Earth Syst. Dyn. 13, 1157-1165 (2022).
  63. Kim, H., Ham, Y. G., Joo, Y. S. & Son, S. W. Deep learning for bias correction of MJO prediction. Nat. Commun. 12, 3087 (2021).
  64. Silini, R., Barreiro, M. & Masoller, C. Machine learning prediction of the Madden-Julian oscillation. NPJ Clim. Atmos. Sci. 4, 57 (2021).
  65. Delaunay, A. & Christensen, H. M. Interpretable deep learning for probabilistic MJO prediction. Geophys. Res. Lett. 49, e2022GL098566 (2022).
  66. Wheeler, M. C. & Hendon, H. H. An all-season real-time multivariate MJO index: development of an index for monitoring and prediction. Mon. Weather Rev. 132, 1917-1932 (2004).
  67. Wallace, J. M. & Gutzler, D. S. Teleconnections in the geopotential height field during the northern hemisphere winter. Mon. Weather Rev. 109, 784-812 (1981).
  68. Mo, K. C. & Ghil, M. Statistics and dynamics of persistent anomalies. J. Atmos. Sci. 44, 877-902 (1987).
  69. Zhu, B. & Wang, B. The 30-60-day convection seesaw between the tropical Indian and western Pacific oceans. J. Atmos. Sci. 50, 184-199 (1993).
  70. Walker, G. T. Correlations in seasonal variations of weather. viii, a further study of world weather. Men. Indian Meteor. Dept. 24, 275-332 (1924).
  71. Huang, R. H. Influence of the heat source anomaly over the western tropical Pacific for the subtropical high over East Asia. In Proc. International Conference on the General Circulation of East Asia. Chendu, China, April 10-15, 1987, 40-50 (1987).
  72. Savarin, A. & Chen, S. S. Pathways to better prediction of the MJO: 2. impacts of atmosphere-ocean coupling on the upper ocean and MJO propagation. J. Adv. Model. Earth Syst. 14, e2021MS002929 (2022).
  73. Hong, C.-C. et al. Causes of 2022 Pakistan flooding and its linkage with China and Europe heatwaves. NOJ Clim. Atmos. Sci. 6, 163 (2023).
  74. Yang, R. et al. Interpretable machine learning for weather and climate prediction: a survey. Preprint at https://arxiv.org/abs/2403. 18864 (2024).
  75. Haiden, T. et al. Evaluation of ECMWF forecasts, including the 2018 upgrade. ECMWF Technical Memorandum No. 831 (European
Centre for Medium-Range Weather Forecasts, 2018). https://doi. org/10.21957/ldw15ckqi.
76. Nogueira, M. Inter-comparison of era-5, era-interim and GPCP rainfall over the last 40 years: process-based analysis of systematic and random differences. J. Hydrol. 583, 1-17 (2020).
77. Lavers, D. A., Simmons, A., Vamborg, F. & Rodwell, M. J. An evaluation of era5 precipitation for climate monitoring. Q. J. R. Meteorol. Soc. 148, 3152-3165 (2022).
78. Hersbach, H. et al. The era5 global reanalysis. Q. J. R. Meteorol Soc. 146, 1999-2049 (2020).
79. Adler, R. F. et al. The global precipitation climatology project (GPCP) monthly analysis (new version 2.3) and a review of 2017 global precipitation. Atmosphere 9, 138 (2018).
80. Albers, J. R. & Newman, M. Subseasonal predictability of the North Atlantic oscillation. Environ. Res. Lett. 16, 1-10 (2021).
81. Yan, Y., Liu, B. & Zhu, C. Subseasonal predictability of South China Sea summer monsoon onset with the ECMWF s2s forecasting system. Geophys. Res. Lett. 48, e2021GL095943 (2021).
82. Richter, J. H. et al. Quantifying sources of subseasonal prediction skill in cesm2. NPJ Clim. Atmos. Sci. 7, 59 (2024).
83. Stan, C. et al. Advances in the prediction of MJO teleconnections in the s2s forecast systems. Bull. Am. Meteorol Soc. 103, E1426-E1447 (2022).
84. Cho, K., Van Merriënboer, B., Bahdanau, D. & Bengio, Y. On the properties of neural machine translation: Encoder-decoder approaches. In Proc. of SSST 2014 – 8th Workshop on Syntax, Semantics and Structure in Statistical Translation (2014).
85. Olivetti, L. & Messori, G. Advances and prospects of deep learning for medium-range extreme weather forecasting. EGUsphere 2023, 1-20 (2023).
86. Doersch, C. Tutorial on variational autoencoders. Preprint at https:// arxiv.org/abs/1606.05908 (2016).
87. Zhao, T., Zhao, R. & Eskenazi, M. Learning discourse-level diversity for neural dialog models using conditional variational autoencoders. Preprint at https://arxiv.org/abs/1703.10960 (2017).
88. Kingma, D. P. & Welling, M. An introduction to variational autoencoders. Found. Trends Mach. Learn. 12, 307-392 (2019).
89. Kingma, D. P. & Ba, J. Adam: A method for stochastic optimization. In Proc. International Conference on Learning Representations (2015).
90. Loshchilov, I. & Hutter, F. Decoupled weight decay regularization. In Proc. International Conference on Learning Representations (2017).
91. Samek, W., Wiegand, T. & Müller, K.-R. Explainable artificial intelligence: Understanding, visualizing and interpreting deep learning models. Preprint at https://arxiv.org/abs/1708.08296 (2017).
92. Weirich-Benet, E. et al. Subseasonal prediction of central European summer heatwaves with linear and random forest machine learning models. Artif. Intell. Earth Syst. 2, e220038 (2023).
93. Weigel, A. P., Liniger, M. A. & Appenzeller, C. The discrete brier and ranked probability skill scores. Mon. Weather Rev. 135, 118-124 (2007).
94. Brier, G. W. Verification of forecasts expressed in terms of probability. Mon. Weather Rev. 78, 1 (1950).
95. Rashid, H. A., Hendon, H. H., Wheeler, M. C. & Alves, O. Prediction of the Madden-Julian oscillation with the Poama dynamical prediction system. Clim. Dyn. 36, 649-661 (2011).
96. Wang, S., Sobel, A. H., Tippett, M. K. & Vitart, F. Prediction and predictability of tropical intraseasonal convection: Seasonal dependence and the maritime continent prediction barrier. Clim. Dyn. 52, 6015-6031 (2019).
97. Chen, L. et al. A machine learning model that outperforms conventional global subseasonal forecast models (Version 1.0) [Figure Dataset]. Zenodo. (2024). https://zenodo.org/records/12662702.
98. Chen, L. et al. A machine learning model that outperforms conventional global subseasonal forecast models (Version 1.0) [Dataset] [Software]. Zenodo. (2023). https://zenodo.org/records/ 10402083.

شكر وتقدير

تم دعم هذا العمل من قبل البرنامج الوطني الرئيسي للبحث والتطوير في الصين تحت منحة 2021YFA0718000، ومؤسسة العلوم الطبيعية الوطنية في الصين تحت منحة 42175052، وإدارة الأرصاد الجوية الصينية (CMA) فريق الابتكار الشبابي (CMA2O24QNO6). نعبر عن امتناننا العميق للباحثين في ECMWF لمساهماتهم القيمة في جمع وأرشفة ونشر وصيانة مجموعة بيانات إعادة التحليل ERA5 وبيانات التوقعات المتوسطة المدى والتوقعات الفعلية من ECMWF.

مساهمات المؤلفين

صمم المشروع كل من H.L. وX.Z وL.C. وB.L. قامت L.C. بتصميم وتنفيذ تدريب النموذج. قام X.Z. وL.C. بإجراء التحليل تحت إشراف H.L. وB.L. وJ.W. وQ.C. وL.W. وC.L. وZ.H. وY.Q. كتب X.Z. وL.C. وراجعا المخطوطة. ساهم J.W. وD.C. وS.X. في تفسير النتائج ومناقشات الديناميات المرتبطة.

المصالح المتنافسة

يعلن المؤلفون عدم وجود مصالح متنافسة.

معلومات إضافية

معلومات إضافية النسخة الإلكترونية تحتوي على مواد إضافية متاحة فيhttps://doi.org/10.1038/s41467-024-50714-1.
يجب توجيه المراسلات والطلبات للحصول على المواد إلى هاو لي، بو لو أو يوان تشي.
معلومات مراجعة الأقران تشكر مجلة Nature Communications هانا كريستنسن والمراجعين الآخرين المجهولين على مساهمتهم في مراجعة هذا العمل. يتوفر ملف مراجعة الأقران.
معلومات إعادة الطباعة والتصاريح متاحة علىhttp://www.nature.com/reprints
ملاحظة الناشر: تظل شركة سبرينغر ناتشر محايدة فيما يتعلق بالمطالبات القضائية في الخرائط المنشورة والانتماءات المؤسسية.
الوصول المفتوح هذه المقالة مرخصة بموجب رخصة المشاع الإبداعي النسبية-غير التجارية-بدون مشتقات 4.0 الدولية، والتي تسمح بأي استخدام غير تجاري، ومشاركة، وتوزيع، وإعادة إنتاج في أي وسيلة أو صيغة، طالما أنك تعطي الائتمان المناسب للمؤلفين الأصليين والمصدر، وتوفر رابطًا لرخصة المشاع الإبداعي، وتوضح إذا قمت بتعديل المادة المرخصة. ليس لديك إذن بموجب هذه الرخصة لمشاركة المواد المعدلة المشتقة من هذه المقالة أو أجزاء منها. الصور أو المواد الأخرى من طرف ثالث في هذه المقالة مشمولة في رخصة المشاع الإبداعي الخاصة بالمقالة، ما لم يُشار إلى خلاف ذلك في سطر الائتمان للمادة. إذا لم تكن المادة مشمولة في رخصة المشاع الإبداعي الخاصة بالمقالة وكان استخدامك المقصود غير مسموح به بموجب اللوائح القانونية أو يتجاوز الاستخدام المسموح به، فستحتاج إلى الحصول على إذن مباشرة من صاحب حقوق الطبع والنشر. لعرض نسخة من هذه الرخصة، قم بزيارة http:// creativecommons.org/licenses/by-nc-nd/4.0/.
(ج) المؤلفون 2024

  1. (v) تحقق من التحديثات
  2. معهد الابتكار وحضانة الذكاء الاصطناعي، جامعة فودان، شنغهاي، الصين. أكاديمية شنغهاي للذكاء الاصطناعي للعلوم، شنغهاي، الصين. المختبر الرئيسي لدراسات توقعات المناخ، الإدارة الوطنية للأرصاد الجوية، مركز المناخ الوطني، بكين، الصين. معهد شيونغ آن للذكاء الاصطناعي في الأرصاد الجوية، شيونغ آن، الصين. جامعة غوتنبرغ، غوتنبرغ، السويد. معهد سكريبس لعلوم المحيطات، جامعة كاليفورنيا سان دييغو، سان دييغو، كاليفورنيا، الولايات المتحدة الأمريكية. كلية علوم البيانات، جامعة فودان، شنغهاي، الصين. معهد البيانات الضخمة، جامعة فودان، شنغهاي، الصين. مختبر وزارة التعليم للتنمية الوطنية والحكومة الذكية، جامعة فودان، شنغهاي، الصين. ساهم هؤلاء المؤلفون بالتساوي: لي تشين، شياوهوي تشونغ، هاو لي، جي وو. البريد الإلكتروني: lihao_lh@fudan.edu.cn; bolu@cma.gov.cn; qiyuan@fudan.edu.cn

Journal: Nature Communications, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41467-024-50714-1
PMID: https://pubmed.ncbi.nlm.nih.gov/39080287
Publication Date: 2024-07-30

A machine learning model that outperforms conventional global subseasonal forecast models

Received: 7 February 2024
Accepted: 19 July 2024
Published online: 30 July 2024

Lei Chen , Xiaohui Zhong , Hao Li , Jie Wu , Bo Lu , Deliang Chen © , Shang-Ping Xie © , Libo Wu (B) , Qingchen Chao , Chensen Lin © , Zixin Hu & Yuan

Skillful subseasonal forecasts are crucial for various sectors of society but pose a grand scientific challenge. Recently, machine learning-based weather forecasting models outperform the most successful numerical weather predictions generated by the European Centre for Medium-Range Weather Forecasts (ECMWF), but have not yet surpassed conventional models at subseasonal timescales. This paper introduces FuXi Subseasonal-to-Seasonal (FuXi-S2S), a machine learning model that provides global daily mean forecasts up to 42 days, encompassing five upper-air atmospheric variables at 13 pressure levels and 11 surface variables. FuXi-S2S, trained on 72 years of daily statistics from ECMWF ERA5 reanalysis data, outperforms the ECMWF’s state-of-the-art Subseasonal-to-Seasonal model in ensemble mean and ensemble forecasts for total precipitation and outgoing longwave radiation, notably enhancing global precipitation forecast. The improved performance of FuXi-S2S can be primarily attributed to its superior capability to capture forecast uncertainty and accurately predict the Madden-Julian Oscillation (MJO), extending the skillful MJO prediction from 30 days to 36 days. Moreover, FuXi-S2S not only captures realistic teleconnections associated with the MJO but also emerges as a valuable tool for discovering precursor signals, offering researchers insights and potentially establishing a new paradigm in Earth system science research.
Subseasonal forecasting, which predicts weather patterns from 2 to 6 weeks in advance, bridges a critical gap between short-term weather forecasts, typically up to 15 days, and longer-term climate forecasts that extend to seasonal and longer timescales . Forecasting at this intermediate subseasonal timescale is indispensable for a variety of applications, including agricultural planning, disaster preparedness, mitigating impacts of extreme events such as heatwaves, droughts,
floods, and cold spells, and water resource management . Despite its significant socioeconomic benefits, subseasonal forecasting has historically not received sufficient attention compared to mediumrange weather and climate predictions. This gap existed because accurate subseasonal forecasts were once considered nearly impossible. Subseasonal forecasts are particularly challenging as they rely on both atmospheric initial conditions, essential in short-term
weather forecasts, and boundary conditions at the Earth’s surface, key to seasonal and climate forecasts . However, neither of these conditions provides sufficient predictability, leaving subseasonal forecasts in a so-called predictability desert. Despite these challenges, recent advances in both physical and statistical modeling have enabled the regular production of subseasonal forecasts globally. Nonetheless, there remains a ongoing, strong demand for their further development to support informed decision-making across various sectors.
Developing an ensemble prediction system (EPS) based on traditional physics-based numerical weather prediction (NWP) models is a widely acknowledged and effective method for enhancing subseasonal forecast accuracy . Major forecasting centers have implemented such EPS for subseasonal forecasts . However, these systems often exhibit considerable biases , particularly in predicting extreme events . The two primary challenges in this field are ensuring an adequate ensemble size within computational constraints and designing ensemble perturbations that accurately reflect uncertainty in key atmospheric and oceanic variability . Enlarging the ensemble size is beneficial for forecast performance , but the substantial computational costs typically limit ensemble sizes to between 4 and 51 members across 11 international forecasting centers . Given these computational limitations, machine learning model emerges as a promising alternative for direct subseasonal forecasting . Machine learning models have the advantages of significantly higher computational efficiency, facilitating the generation of a large number of ensemble members which are crucial for prediction skill and reliability . Recent advancements in machine learning for mediumrange weather forecasting have demonstrated that machine learning models can outperform the high-resolution forecasts (HRES) generated by the European Centre for Medium-Range Weather Forecasts (ECMWF), widely considered as the most accurate global weather forecasts .
Machine learning models have achieved made significant strides in medium-range weather forecasting and seasonal forecasting , but their success in subseasonal forecasting has been less pronounced . This shortfall primarily stems from the limited range of variables incorporated into the models, and more importantly, from the inadequate methods employed for ensemble generation. Conventional machine learning techniques for ensemble forecasting, such as introducing random perturbations into initial conditions and altering model structures, overlook the background flow and consequently lead to rapid reduction in ensemble spread. The inadequate representation of the complexities limits the performance of these prior machine learningbased subseasonal forecasting models, which do not yet rival that of traditional EPS based on NWP models. To overcome these challenges, we introduce the FuXi Subseasonal-to-Seasonal (FuXi-S2S) model, representing a significant advancement in machine learning for subseasonal forecasting. This model is designed to generate global daily mean forecasts for 42 days from initialization. Unlike previous models that incorporated a limited set of variables, it incorporates a comprehensive suite of variables, instead of a couple of variables in previous models: 5 upper-air atmospheric variables at 13 pressure levels and 11 surface variables. Furthermore, it features a innovative perturbation module specifically designed to generate flow-dependent perturbations for ensemble forecasting. This module leverages vast amounts of historical data to learn probability distributions, thereby introducing flowdependent perturbations directly into the model’s hidden features. Compared to conventional NWP ensemble forecasting methods, which often struggle with constructing initial condition perturbations due to the complexities of multivariate interactions and the need to maintain dynamic balance and ensemble spread in simulations , our approach of introducing perturbations directly into the model’s latent space, presenting an effective alternative. This perturbation module significantly enhances the performance of the FuXi-S2S forecasts, as demonstrated
in Supplementary Fig. 1. More details about the FuXi-S2S model architecture are available in “Methods”.
Remarkably, FuXi-S2S outperforms the ECMWF Subseasonal to Seasonal (S2S) ensemble, which is recognized as the most skillful S2S modeling system, in producing both the ensemble mean and probabilistic forecasts . Its efficacy is particularly evident in extreme total precipitation (TP) forecasting, as exemplified by its accurate forecasts for the 2022 Pakistan floods. Such capability is closely related to FuXiS2S’s improved prediction of the Madden-Julian Oscillation (MJO) , a key driver of global climate patterns, extending the skillful MJO prediction from 30 days to 36 days. These results further confirm that the notable improvement in FuXi-S2S’s performance can be primarily attributed to the innovative perturbation module for ensemble generation. Another promising result is the ability of the FuXi-S2S model to identify potential precursor signals to physical processes. Beyond mere accuracy, in many applications involving machine learning forecasts, it is imperative to understand and validate the decisionmaking mechanisms of these models. Such understanding not only leads to enhanced trust in the models’ predictions but also increases the likelihood of implementing effective actions, particularly in mitigating the risks associated with extreme events. Therefore, interpreting machine learning models to align their reasoning with established knowledge becomes crucial. Recent developments in explainable machine learning methods have facilitated this interpretation. This study delves into the 2022 Pakistan floods, investigating the FuXi-S2S model’s predictions to identify key geographic regions that significantly impact its predictive accuracy. This is achieved through the generation and analysis of saliency maps , wherein the identified regions in close alignment with insights from previous studies . Therefore, we argue that FuXi-S2S transcends traditional NWP models in terms of accuracy and speed, potentially unveiling previously unrecognized processes within Earth’s system in subseasonal forecasting .

Results

This study conducts a thorough evaluation of the 51-member FuXi-S2S forecasts by analyzing testing data spanning from 2017 to 2021. It compares the performance of with that of the 11 -member ECMWF S2S reforecasts from the model cycle C47r3 over the same period. The analysis primarily focuses on average forecasts for week 3 (days 15-21), week 4 (days 22-28), week 5 (days 29-35), and week 6 (days 36-42), weeks 3-4, and weeks 5-6. The evaluation employs a comprehensive set of metrics, including deterministic metrics for the ensemble mean, probabilistic metrics for all ensemble members, prediction skills specific for MJO forecasts, and tailored assessments for extreme events, notably the 2022 Pakistan floods. Furthermore, the study explores the underlying processes driving the FuXi-S2S model’s predictions for the 2022 Pakistan floods. This is accomplished by generating and analyzing the saliency maps, which provide profound insights into the model’s predictive processes.
Additional evaluations, including an analysis of energy spectra , are available in the Supplementary Material.

Deterministic metrics

This subsection compares the performance of ensemble mean forecasts from FuXi-S2S and ECMWF S2S based on deterministic metrics. Figure 1 presents the globally-averaged and latitude-weighted temporal anomaly correlation coefficient (TCC) for both FuXi-S2S and ECMWF S2S, considering four variables: TP, 2 m temperature (T2M), geopotential at 500 hPa (Z500), and outgoing longwave radiation (OLR), across forecast lead times of , and weeks. Significance testing is conducted as described in “Evaluation method”. When the FuXi-S2S forecasts do not show a statistically significant improvement over the ECMWF S2S reforecasts, these are indicated with a pale color scheme. It is evident that the ensemble mean
Fig. 1 | Comparison of globally-averaged and latitude-weighted temporal anomaly correlation coefficient (TCC) of the ensemble mean between ECMWF subseasonal-to-seasonal (S2S) reforecasts (in blue) and FuXi-S2S forecasts (in red) for total precipitation (TP), 2 m temperature (T2M), geopotential at 500 , and outgoing longwave radiation (OLR). Rows 1 and 2 represent the
FuXi-S2S

performance across these variables, utilizing all testing data from the period spanning from 2017 to 2021. A bootstrapping approach, repeated 1000 times, is used for significance testing. When the FuXi-S2S forecasts fail to show a statistically significant improvement over the ECMWF S2S reforecasts at the confidence level, a pale color scheme is used to denote these results.
forecasts from FuXi-S2S significantly outperform ECMWF S2S for TP and OLR, but not for T2M and Z500. The analysis is based on the averaged TCC computed from all testing data spanning the period from 2017 to 2021. The FuXi-S2S forecasts generally demonstrate higher TCC values than the ECMWF S2S reforecasts for TP and OLR at all lead times, while comparable TCC values for Z500 and T2M. Specifically, regarding Z500, the FuXi-S2S forecasts are superior to the ECMWF S2S reforecasts at lead times of , and weeks, and have inferior performance at lead times of 6 and 5-6 weeks.
Supplementary Fig. 2 provides the spatial distributions of temporally-averaged TCC for both ECMWF S2S and FuXi-S2S, along with the differences in TCC between FuXi-S2S and ECMWF S2S for TP, T2M, Z500, and OLR forecasts at lead times of and weeks, respectively. The spatial distributions of TCC reveal considerably higher values over tropics, and greater values over oceans than over land. The TCC differences are described in red (positive values), blue (negative values), and white (zero values) patterns, suggesting whether FuXi-S2S’s performance is superior, inferior, or equivalent to ECMWF S2S, respectively. Overall, FuXi-S2S demonstrates positive TCC differences for TP and OLR in most regions worldwide, consistent with the findings presented in Fig. 1. Moreover, FuXi-S2S also outperforms ECMWF in a majority of extra-tropical regions for both T2M and Z500, although its performance is generally less skillful in the tropical areas.

Probabilistic metrics

Deterministic metrics, evaluated using the ensemble mean, exhibit limited predictive skill, with TCC values below 0.5 for all subseasonal forecast lead times. Therefore, ensemble forecasts are essential for detecting predictable signals at subseasonal timescales.
The first two rows of Fig. 2 present the spatial distribution of the temporally-averaged ranked probability skill score (RPSS) for ECMWF S2S and FuXi-S2S, as well as the RPSS differences between FuXi-S2S and ECMWF S2S for TP forecasts over 3-4 and 5-6 week lead times. This analysis utilizes RPSS data which are temporally averaged from 2017 to 2021. The red contour lines in the first and second columns highlight areas with positive RPSS values, which indicate more skillful prediction than climatology forecast can be obtained over these areas. Notably, FuXi-S2S predicts more areas with positive RPSS values than ECMWF S2S. The color coding in the right panels of Fig. 2
(red, blue, and white) indicates regions where FuXi-S2S performs better, worse, or equivalently compared to ECMWF S2S, respectively. The global distribution of RPSS suggests that both ECMWF S2S and FuXi-S2S primarily exhibit skill in tropical regions, whereas they lack skill in the extra-tropics compared to climatology. In contrast, RPSS demonstrates positive values (depicted in red color) in tropical regions, indicating enhanced predictive skills relative to climatology. Moreover, the RPSS values are notably higher over oceans compared to land areas. Predominantly, FuXi-S2S demonstrates nearly global positive RPSS differences for TP, except in some tropical regions where both models have quite high RPSS values. Compared to ECMWF S2S, whose skillful predictions are primarily confined to tropical ocean areas, FuXi-S2S demonstrates the capability of skillful predictions over more extra-tropical regions, such as East Asia, the North Pacific, and the Arctic.
The latitude-weighted RPSS for the same 4 variables as in Fig. 1 over forecast lead times of , and weeks are given in Supplementary Fig. 6. FuXi-S2S shows higher RPSS values than ECMWF S2S across most regions for all the examined variables: TP, T2M, Z500, and OLR. This superiority is especially noticeable in extra-tropical averages. However, in the tropics, ECMWF S2S outperforms FuXi-S2S at lead times of 3 to 6 weeks for 1-week averages, whereas FuXi-S2S surpasses ECMWF S2S for 2-week averages. This discrepancy in performance likely arises from the fact that 1-week averages filter out variability with periods shorter than 2 weeks, while 2-week averages attenuate variability with periods shorter than 4 weeks. Thus, the skill differences between the 1-week and 2-week averages may reflect FuXi-S2S’s enhanced ability in capturing lowerfrequency variability. Furthermore, a previous study suggests that dynamical S2S models, particularly ECMWF S2S, demonstrate improved performance in the central-eastern Pacific, potentially due to their effective simulation of the realistic air-sea interactions in these regions.

Extreme forecast

A primary target of subseasonal forecasts is extreme weather events, to better prepare for disasters like droughts and floods. This subsection focuses on the prediction skills for extreme precipitation events. Such events are identified when TP exceeds the 90th climatological
Fig. 2 | Maps displaying the average Ranked Probability skill Score (RPSS) (first and second rows) and Brier Skill Score (BSS) (third and fourth rows) without latitude weighting, comparing ECMWF subseasonal-to-seasonal (S2S) (first column) and FuXi-S2S (second column) forecasts. Additionally, the third column depicts the difference in RPSS and BSS between FuXi-S2S and ECMWF S2S for total precipitation (TP) at forecast lead times of weeks (first and third rows) and weeks 5-6 (second and fourth rows), utilizing all testing data from 2017 to 2021.
Red contour lines in the first and second columns indicate areas with positive values of RPSS and BSS. Stippling on the map denotes areas where the skill score is statistically significant at the 97.5% confidence level. Specifically, in columns 1 and 2, stippling indicates regions where the skill scores of the ECMWF S2S and FuXi-S2S models significantly surpass those of climatology. In column 3, stippling highlights areas where the FuXi-S2S model significantly outperforms the ECMWF S2S.
percentile, a threshold that varies based on grid location, forecast initialization time, and forecast lead time.
The last two rows of Fig. 2 show the spatial distributions of the temporally-averaged Brier Skill Score (BSS) for the extreme precipitation events, for ECMWF S2S and FuXi-S2S, and their differences over 3-4 and 5-6 week lead times. Similar to spatial pattern of RPSS, FuXi-S2S generally exhibits more regions with positive values of BSS than ECMWF S2S, suggesting more areas with skill relative to climatological forecasts. Similar to spatial pattern of RPSS, the BSS values are considerably higher over oceans than over land and decrease from lower latitudes to higher latitudes. Predominantly, the BSS differences favor FuXi-S2S in TP over land and in extra-tropical regions, marked by widespread red patterns. This suggests FuXi-S2S’s dominance over ECMWF S2S in predicting extreme TP across land and extra-tropics, which is of great importance for disaster preparedness and early warning.
Supplementary Fig. 7 compares the latitude-weighted BSS between FuXi-S2S and ECMWF S2S, focusing on TP, T2M, Z500, and OLR in five geographical regions: global, in the extra-tropics ( and ), in the tropics ( ), over land, and over the ocean. Globally, FuXi-S2S outperforms ECMWF S2S in terms of BSS for TP, T2M, and OLR. Notably, in contrast to ECMWF S2S,
which exhibits consistently negative globally-averaged BSS values for TP across all lead times, FuXi-S2S demonstrates positive values for forecast lead times of , and weeks. In the extra-tropical regions, though the BSS scores are relatively lower in comparison to the global average, FuXi-S2S consistently exhibits superior performance compared to ECMWF S2S across all four variables. A similar pattern emerges in tropical regions, where FuXi-S2S demonstrates superior performance over ECMWF S2S for TP and OLR while achieving comparable accuracy in T2M and Z500. Over land areas, FuXi-S2S demonstrates consistently higher BSS values for TP and T2M, suggesting its superior ability to provide more accurate forecasts of extreme rainfall and high temperatures compared to ECMWF S2S.

MJO forecast

Recent studies have demonstrated the importance of accurately modeling various sources of subseasonal predictability, particularly the , for improving subseasonal prediction skills. The MJO has a significant impact on global weather and climate, serving as a primary source of predictability at subseasonal timescales due to its quasi-periodic nature . Accurate MJO prediction is essential for reliable subseasonal predictions. Although current state-of-the-art dynamical forecasts can predict the MJO up to 3-4 weeks in advance,
Fig. 3 | Comparison of real-time multivariate Madden-Julian Oscillation (MJO) (RMM) bivariate Correlation (COR) of the ensemble means between ECMWF subseasonal-to-seasonal (S2S) reforecasts (in blue) and FuXi-S2S forecasts (in red) using all testing data from 2017 to 2021. a Comparison of RMM bivariate COR as a function of forecast lead times. Dashed black line signifies the prediction
skill threshold of . The RMM bivariate COR is depicted as a function of the month of initialization (x-axis) and forecast lead time (y-axis), with red and blue lines indicating the skillful MJO prediction days of ECMWF S2S (in blue) and FuXiS2S (in red), respectively.
this falls short of the theoretical potential predictability of approximately 6-7 weeks . In recent years, increasing efforts have focused on applying machine learning models to improve MJO forecasts, either by post-processing dynamical forecasts or through direct forecasting . However, only improving MJO predictions with machine learning models does not inherently ensure improved forecasts of related weather phenomena, such as tropical cyclones and monsoons, which also depend on accurate predictions of various weather parameters by the model. Therefore, continuous improvement in forecasting models is essential for advancing subseasonal prediction capabilities. This section specifically examines the performance of our FuXi-S2S model in MJO forecasts, although it is not explicitly optimized for this purpose.
In this study, we employed the real-time multivariate MJO (RMM) index , along with the commonly used metrics of bivariate correlation coefficient (COR), to evaluate the forecasting skill of the MJO. The RMM index used for verification was calculated using the Climate Prediction Center (CPC) OLR (CBO) data, in conjunction with the ERA5 zonal-wind component at 850 hPa and 200 hPa . Figure 3 presents the bivariate correlation (COR) skills of the RMM index for the ensemble mean of ECMWF S2S reforecasts and FuXi-S2S forecasts, averaged over the testing data spanning from 2017 to 2021. The results show a decrease in COR values as forecast lead times increase. Particularly, FuXi-S2S outperforms ECMWF S2S in MJO prediction, maintaining higher COR values for up to 42 days. When applying a COR threshold of 0.5 to determine skillful MJO forecast, FuXi-S2S extends the skillful forecast lead time from 30 days to 36 days, surpassing the performance of ECMWF S2S. Furthermore, the MJO prediction skills also depend on the seasonal cycle, as illustrated in Fig. 3. Both FuXi-S2S and ECMWF S2S demonstrate higher MJO prediction skills in September and October. Additionally, FuXi-S2S exhibits superior skills compared to ECMWF S2S during the boreal spring and winter, with skillful predictions extending beyond 42 days in April and May, which is the longest forecast lead time achievable by the FuXi-S2S model. Moreover, Supplementary Fig. 9 presents the COR and error for the amplitude and phase of the MJO. These are calculated using the ensemble mean of ECMWF S2S reforecasts and FuXi-S2S forecasts, averaged across over the 2017-2021 testing dataset. The results suggest that the FuXi-S2S model outperforms the ECMWF S2S model in predicting the MJO, primarily due to its superior capability in
forecasting the MJO phase. Additionally, FuXi-S2S demonstrates smaller amplitude errors, suggesting it more accurately maintains the amplitude of MJO events.
A two-dimensional phase-space diagram is commonly used to characterize the phase and amplitude of the MJO, using the x-axis and y -axis to represent the first and second principal components of Empirical Orthogonal Functions (EOFs) (RMM1 and RMM2), respectively. Supplementary Fig. 10 illustrates the forecast performance of four distinct MJO events with initialization dates of 27 June 2018, 3 November 2018, 18 April 2019, and 21 March 2021, as predicted by ECMWF S2S and FuXi-S2S. Data points on this two-dimensional phasespace diagram are plotted at 5-day intervals. The phase of the MJO is determined by the azimuth of the combined RMM indices 1 and 2 (RMM1 and RMM2), while its amplitude is represented by the radial distance from the origin. As visually shown in Supplementary Fig. 10, the counterclockwise movement of data points signifies the eastward propagation of MJO-associated convection, with the distance between successive points reflecting the propagation speed. In comparison to the observed MJO derived from CBO and ERA5 reanalysis data, both ECMWF S2S and FuXi-S2S exhibit slower propagation speeds and reduced amplitudes as the forecast lead time increases, particularly noticeable for MJO forecasts initialized on 21 March 2021. However, FuXi-S2S shows a more consistent alignment with observations across all MJO phases, especially in mitigating the negative amplitude biases in MJO forecasts when compared to ECMWF S2S.
The MJO originates from interactions of tropical convection and circulation but its effect is of global reach. Indeed, large TCC for Z500 over the extra-tropical Pacific is found along the path of the Pacific North/South American (PNA/PSA) teleconnection pattern (Supplementary Fig. 2, rows 6 and 7). Compared to ECMWF S2S, improved MJO forecast in FuXi-S2S elevates TCC for these teleconnection patterns, especially along the PSA wave train in the Southern Hemisphere. Furthermore, the MJO is critical for stimulating these important teleconnection patterns, significantly affecting extra-tropical anomalies. Therefore, the accurate representation of MJO-related teleconnections is imperative for effective subseasonal forecasts. Supplementary Fig. 11 demonstrates that the FuXi-S2S model showcases enhanced skills in MJO prediction and realistic simulations of MJO teleconnections, which substantially contribute to its superior performance in subseasonal forecasts, particularly over extra-tropical regions.
Fig. 4 | Comparative analysis for the 2022 Pakistan floods predictions between the ECMWF subseasonal-to-seasonal (S2S) and FuXi-S2S models as well as the precursor signals that contributed to accurate predictions by the FuXi-
S2S model. Comparison of spatially and temporally averaged standardized total precipitation (TP) anomaly (a) over the 2 weeks from August 16th to August 31st, 2022, showcasing GPCP observations (in black) alongside predictions from ECMWF S2S real-time forecasts (in blue) and FuXi-S2S forecasts (in red), with initialization dates: August 11th (08-11, MM-DD), August 8th (08-08), August 4th (08-04), August 1st (08-01), July 28th (07-28), July 25th (07-25), and July 21st (07-21). The black lines on the bar of ECMWF S2S and FuXi-S2S forecasts represent the 25th and 75th percentiles. For the comparison of temporally averaged standardized TP anomaly maps (b), the first column represents GPCP observations, while the second and
third columns display predictions from ECMWF S2S and FuXi-S2S, respectively, both initialized on July 28th, and the fourth and fifth columns correspond to predictions from ECMWF S2S and FuXi-S2S, respectively, with an initialization date of July 21st. Green contour indicates the border line of Pakistan. The saliency maps (c) were generated using the gradient of the negative standardized TP anomaly, averaged over the Pakistan region, in relation to the input SST. These maps correspond to forecasts initialized on July 28th (07-28, first column) and July 21st (0721 , second column). Here, the red and blue colors indicate the positive and negative correlations between the negative of standardized TP and variations in SST. The black lines on the bars in this figure represent the 25th and 75th percentiles of the ensemble forecasts for each start date for both ECMWF and FuXi-S2S models.
This study highlights FuXi-S2S proficiency in predicting the MJO. We envision that FuXi-S2S could serve as a pivotal tool in investigating other primary modes of subseasonal variability, such as the Boreal Summer Intraseasonal Oscillation (BSISO) , North Atlantic Oscillation (NAO) , and East Asia-Pacific (EAP) pattern . Additionally, it would be worthwhile to explore how the prescribed fixed sea surface temperature (SST) or its absence impacts the forecast performance of the MJO. Savarin and Chen demonstrated that either using a coupled atmosphere-ocean model or updating SST with observed values is essential for accurately modeling the eastward propagation of the mJO. However, this analysis is beyond the scope of the current study and will be addressed in future research.

Prediction of the Pakistan floods

In 2022, Pakistan experienced a series of exceptionally intense monsoon rainfall surges from early July to late August, resulting in total
rainfall that reached a level approximately four standard deviations above the climatological mean . This extreme rainfall event led to a significant humanitarian disaster, leaving over 2.1 million people homeless and resulting in 1730 fatalities. According to the World Bank, the economic damages and losses exceeded USD 30 billion . Consequently, it is important to assess the ability of subseasonal forecasts to predict such extreme rainfall events.
Figure 4 illustrates the observed standardized TP anomaly alongside predictions that were initialized on different dates, generated by both the FuXi-S2S and ECMWF S2S models. These observations, taken from the Global Precipitation Climatology Project (GPCP), are spatially averaged over the Pakistan region ( in longitude and in latitude), and temporally over a 2-week period from August 16th to August 31st, 2022, corresponding to the period of most intense rainfall. The standardized anomaly for observed rainfall is standard deviations above the climatological mean. It is evident that
the ECMWF S2S model considerably underestimates rainfall intensity for forecasts initialized on July 21st, achieving only about one-third of the observed values. The ECMWF S2S forecasts gradually converge toward observations as the initialization dates approach the actual event. In contrast, FuXi-S2S exhibits superior forecast performance in predicting the intensity of extreme rainfall events earlier compared to ECMWF S2S. Specifically, FuXi-S2S predicts rainfall levels of at least 4 standard deviations above the climatological mean for forecasts initialized on July 21st, which is approximately 4 weeks in advance. Moreover, the spatial distributions of the standardized TP anomaly reveal that the FuXi-S2S predicted TP pattern more closely matches the observations.
Forecast skill typically improves with decreasing lead time, as in the ECMWF S2S model. The rainfall anomaly grows in FuXi-S2S forecasts initialized on July 28 (lead time of 18 days), albeit with a large forecast spread, possibly due to SST influence. Indeed, the saliency maps show that the FuXi-S2S forecasts initialized on July 28 and July 21 successfully captured predictable signals from SST anomalies in the tropical central Pacific and western Indian Ocean (Fig. 4c). At shorter lead times, the SST influence decreases while the effect of atmospheric initial conditions increases. The varying importance of SST and initial conditions may cause variability in the FuXi-S2S forecasts with lead time.

Discovery of precursor signals for the 2022 Pakistan floods prediction

Data-driven machine learning forecasting models, such as FuXi-S2S, often lack explicit integration of prior knowledge about the physical system they aim to predict. As a result, they are often referred to as “black boxes”. Although FuXi-S2S has shown accuracy in previous subsections, the opacity of its predictive processes can diminish confidence in its reliability. Therefore, it is imperative to interpret FuXiS2S, ensuring that their underlying reasoning is consistent with established understanding of weather systems. Here, we generated saliency maps to disentangle the key driving processes behind the FuXi-S2S model’s prediction of the 2022 floods in Pakistan.
In this study, we utilized the negative absolute values of the TP anomaly, averaged across the Pakistan region (outlined by the green box in Fig. 4c), as a loss function. By implementing backward propagation of this loss function to calculate gradients, we obtained the saliency maps. These maps use red and blue colors to signify positive and negative correlations, respectively between the negative of standardized TP anomaly and SST. Specifically, blue (red) areas indicate that a decrease (increase) in SST is associated with an increase (decrease) in the negative of standardized TP anomaly, thereby leading to an increase (decrease) in TP anomaly. Analysis of these saliency maps facilitated the identification of potential precursor signals and sources of predictability that contributed to the occurrence of the extreme TP event. As illustrated in Fig. 4c, SST precursor signals, identified in forecasts initialized on different dates (July 28th and July 21st in 2022), show remarkable consistency. These signals indicate a consistent cooling of SST in the equatorial central Pacific and the tropical western Indian Ocean, along with warming in the tropical eastern Pacific. This spatial pattern aligns closely with findings from previous studies , which pinpointed the rapid development of a La Niña in the tropical Pacific and a negative phase of the Indian Ocean Dipole in the summer of 2022 as key precursor signals and driving forces of Pakistan’s intense TP event. Our results confirm that the high predictive skill of the FuXi-S2S model can be attributed to its effective capture of the primary predictable sources of this event. Furthermore, these findings demonstrate the model’s potential as a valuable tool for rapidly exploring the mechanisms behind extreme events and uncovering teleconnections within Earth’s systems, thereby enhancing our physical understanding. Here, we focus on the gradient with respect to SST. Nevertheless, it is important to acknowledge the existence of
other significant precursor signals that may be associated with this extreme event, including , and Z anomalies as noted in ref. 73. A more comprehensive examination of these factors is intended for future research.

Discussion

In this paper, we introduced FuXi-S2S, a machine learning-based subseasonal forecasting model. This model provides global forecasts of daily mean values for up to 42 days, with a daily temporal resolution and spatial resolution encompassing five upper-air atmospheric variables across 13 pressure levels and 11 surface variables. The performance of FuXi-S2S was rigorously evaluated against ERA5 reanalysis data and compared with ECMWF S2S reforecasts. A comprehensive suite of metrics was employed for this evaluation, including the deterministic metrics of the ensemble mean, the probabilistic metrics of the ensemble forecast, and the capability to predict extreme events. Our results demonstrated that FuXi-S2S surpasses ECMWF S2S in forecast accuracy for the evaluated variables. Furthermore, FuXi-S2S significantly improves accuracy in predicting the MJO, extending the skillful MJO prediction from 30 days to 36 days. This improvement is particularly important given the MJO’s influence on global climate patterns, and consequently, it improves the model’s TP) forecast accuracy globally. Moreover, FuXi-S2S has shown utility in practical scenarios, such as its superior performance in predicting the extreme rainfall during the 2022 Pakistan floods earlier than the ECMWF S2S model. This early prediction capability is vital for improving disaster preparedness and response.
A key contributor to the superiority of FuXi-S2S is its innovative method of generating perturbations, which is essential for its successful ensemble forecasting. Unlike conventional models that employ random or meticulously calculated perturbations in initial conditions, FuXi-S2S incorporates background flow-dependent perturbations into its hidden features. These flow-dependent perturbations have shown to significantly enhance model’s subseasonal forecast performance, as illustrated in Supplementary Fig. 1. FuXi-S2S, as a machine learning model, also distinguishes itself by its ability to generate large ensemble forecasts rapidly and efficiently, requiring significantly less time and computational resources than traditional models. Specifically, it can complete a comprehensive 42 -day forecast with daily time steps in using an Nvidia A100 GPU for a single member. Ensemble size is a critical determinant of the ensemble forecast skill. Research suggests that the optimal number of members for subseasonal forecasts potentially falls within the range of 100 to 200 members . To ensure a fair comparison with the ECMWF S2S model, we have currently limited the FuXi-S2S model to a 51-member ensemble. However, it’s important to note that FuXi-S2S is capable of generating larger ensembles with only a moderate increase in computational demands. Our Supplementary Fig. 15illustrates that increasing the ensemble size to 101 members further enhances the forecast performance of FuXi-S2S compared to the 51-member ensemble.
Beyond its computational efficiency and superior accuracy, FuXiS2S notably excels in identifying precursor signals and disentangling the complex processes underlying climate extremes, as demonstrated by its accurate prediction of the 2022 floods in Pakistan. Many subseasonal forecasting challenges stem from the limited understanding of these complex processes. Traditional physics-based models often rely on oversimplified representations of physical processes, which diminishes their forecast performance and analytical depth. In contrast, FuXi-S2S demonstrates proficiency in learning complex patterns and identifying subtle teleconnections from vast amounts of data. This approach resonates with Albert Einstein’s insight, “You can’t solve a problem with the ways of thinking that created it.” In our study of the 2022 extreme rainfall event in Pakistan, we demonstrate that backward propagation and the resulting saliency maps successfully reveal that FuXi-S2S makes accurate forecasts by effectively capturing the key
Table 1 | A summary of all the upper-air and surface variable names and their abbreviations in this paper
Type Full name Abbreviation
Upper-air variables geopotential Z
temperature T
component of wind U
component of wind V
specific humidity Q
Surface variables 2 m temperature T2M
2 m dewpoint temperature D2M
sea surface temperature SST
outgoing longwave radiation OLR
10 m u wind component U10
wind component V10
100 m u wind component U100
component V100
mean sea-level pressure MSL
total column water vapor TCWV
total precipitation TP
predictable sources associated with this event. Moreover, such gradient-based interpretation methods aid in explaining weather and climate forecasts made by machine learning models, such as the FuXiS2S model . Therefore, we advocate for a paradigm shift in the application of machine learning models like FuXi-S2S. The focus should not extend beyond enhancing forecast accuracy to include the development of a comprehensive framework for discovering previously unknown processes within the Earth’s system . We foresee a growing reliance on machine learning models like FuXi-S2S within the scientific community, acknowledging their essential role in advancing scientific discovery in Earth system science.
While FuXi-S2S offers a computationally efficient and accurate alternative to conventional NWP models for subseasonal forecasting, it also presents significant opportunities for improvement. For instance, the ECWMF S2S model runs at a spatial resolution of , which is considerably finer than the resolution of FuXi-S2S. Currently, FuXi S2S predicts daily mean values up to 50 hPa and lacks critical weather parameters such as daily maximum and minimum temperatures, which are essential for some applications. Furthermore, given the known discrepancies between the ERA5 TP data and actual observations, as noted in refs. 76,77, GPCP observations have been utilized to evaluate the TP forecast performance for both ECMWF S2S and FuXiS2S (refer to Supplementary Fig. 16). Anticipated future enhancements to the FuXi-S2S model include increasing the spatial resolution from to , incorporating additional weather parameters, extending the forecast beyond the current upper limit of 50 hPa , and employing more accurate TP data sources to enhance forecast accuracy.

Methods

Data

ERA5 stands as the fifth iteration of the ECMWF reanalysis dataset, offering a rich array of surface and upper-air variables. It operates at a remarkable temporal resolution of 1 h and a horizontal resolution of approximately 31 km , covering data from January 1950 to the present day . Recognized for its expansive temporal and spatial coverage coupled with exceptional accuracy, ERA5 stands as the most comprehensive and precise reanalysis archive globally. In our study, we utilize daily statistics derived from the 1-hourly ERA5 dataset, which has a spatial resolution of (comprising latitude-longitude grid points) and a temporal resolution of 1 day. It serves as the sole data source for training the FuXi-S2S model.
Evaluating MJO predictions against MJO indices derived from satellite-observed OLR data is a common practice. Therefore, alongside the ERA5 reanalysis data, a newly developed OLR dataset called the Climate Prediction Center (CPC) OLR (CBO) has emerged. Spanning from 1991 to the present day, this dataset undergoes near realtime updates. While showing slight differences in magnitude compared to the U.S. National Oceanic and Atmospheric Administration (NOAA) Advanced Very High-Resolution Radiometer (AVHRR) OLR, the CBO dataset notably exhibits a high level of similarity in both pattern and magnitude of anomalies. In our research, we utilize the CBO data, which has a spatial resolution of and a temporal resolution of 1 day. This data serves as the ground truth for OLR in the identification and verification of MJO events. Furthermore, for the assessment of rainfall in the Pakistan region, observed rainfall data are sourced from the GPCP dataset . It is noteworthy that the MJO indices derived from ERA5 OLR data closely align with those derived from CBO OLR data.
The FuXi-S2S model forecasts a total of 76 variables, encompassing 5 upper-air atmospheric variables across 13 pressure levels ( 50 , , and 1000 hPa ), and 11 surface variables. Among the upper-air atmospheric variables are geopotential ( Z ), temperature ( T ), u component of wind ( U ), v component of wind (V), and specific humidity (Q). The surface variables include 2 m temperature (T2M), 2 m dewpoint temperature (D2M), sea surface temperature (SST), OLR, 10 m u wind component (U10), 10 m v wind component (V10), 100 m u wind component (U100), 100 m v wind component (V100), mean sea-level pressure (MSL), total column water vapor (TCWV), and TP. OLR is known as the negative of top net thermal radiation (TTR) in ECMWF convention. Table 1 provides a comprehensive list of these variables along with their abbreviations. Variables such as U100 and V100 were selected for their potential utility in wind energy forecasting. The selection of the SST is based on prior research, which suggests that slowly evolving variables like SST are crucial for identifying predictable signals . OLR was selected due to its significance in representing MJO events through OLR anomalies.
The model’s training relies on 67 years of data spanning from 1950 to 2016, while evaluation involves a 5-year dataset from 2017 to 2021. The z-score normalization technique is employed to normalize all input and output variables, thereby ensuring uniformity in their mean and variance. For upper-air variables, the mean and standard deviation are calculated separately for different vertical levels, using only the training dataset. Additionally, the dataset for the year 2022 undergoes evaluation and comparison against the ECMWF real-time S2S forecasts, specifically concerning the catastrophic flooding in Pakistan. More detailed evaluations of TP and MJO predictions for the year 2022 can be found in the Supplementary Material.
In certain cases, subseasonal forecasts receive regular updates through the implementation of the latest model, incorporating research discoveries tailored for operational use . For instance, the ECMWF S2S reforecasts, often termed hindcasts, which are generated on-the-fly by employing the most recent model version available at the time of forecast generation. In our research, we utilize the ECMWF S2S reforecasts generated from model cycle C 47 r 3 . These reforecasts encompass initialization dates over 20 years, ranging from January 3, 2002, to December 29, 2021. The ECMWF S2S reforecasts are initialized twice weekly, aligning with the real-time forecasts. Additionally, our comparative analysis involves employing the 51 -member ECMWF real-time S2S forecast for the year 2022. For the analysis using testing data from 2017 to 2021, anomalies for all variables are defined as deviations from the climatological mean calculated over the 15-year period from 2002 to 2016. Meanwhile, for the analysis based on testing data in the year 2022, the climatological mean is calculated over the period from 2002 to 2021. Furthermore, a set of hindcasts from 2002 to 2016 is generated for FuXi-S2S, which are used to establish a
a FuXi-S2S inference stage
b FuXi-S2S training stage
Fig. 5 | Schematic diagram of the structures of the FuXi Subseasonal-toSeasonal (FuXi-S2S) model. a Inference stage of the FuXi-S2S model. represents the hidden feature generated by the Encoder from the input data. The perturbation vector is generated by the perturbation module, resulting in the perturbed
hidden feature . Training stage of the FuXi-S2S model. and are the low-rank multivariate Gaussian distributions generated by encoders P and Q , respectively. The Kullback-Leibler (KL) divergence loss measures the discrepancy between the distributions predicted by both encoders, and .
climatology. This climatology is then subtracted from the FuXi-S2S forecasts for the testing data spanning from 2017 to 2021. This process facilitates the calculation of FuXi-S2S anomalies for evaluations.
To ensure equitable comparisons, we evaluate FuXi-S2S forecasts specifically on identical initialization dates corresponding to those utilized for both the ECMWF S2S reforecasts and forecasts. This approach facilitates a fair and direct assessment between FuXi-S2S and ECMWF S2S.

FuXi-S2S model

Most state-of-the-art machine learning models utilized in mediumrange weather forecasting are built upon encoder-decoder architectures . These structures are favored due to their proficiency in processing and generating sequential and spatial data. Within these architectures, the encoder processes key features from the input data and transforms them into a compressed and abstract representation in the latent space. The decoder then utilizes this representation to generate weather forecasts. The primary objective of training these models is to minimize differences between the model’s output and the target data. However, the standard encoder-decoder structures are inherently deterministic, producing identical forecasts for the same inputs, which limits their applicability in generating ensemble forecasts. To overcome this limitation, we introduce the FuXi-S2S model, drawing inspiration from Variational Autoencoders (VAEs) . VAEs are inherently probabilistic, making them well-suited for tasks that require uncertainty quantification. Like VAEs, the FuXiS2S model’s encoder does not merely generate a static hidden feature from input data. Instead, it transforms input data into a Gaussian distribution in the latent space, which captures the probabilistic characteristics of the data, along with a static hidden feature. Then, the decoder combines samples from the Gaussian distribution with the static hidden feature to generate forecasts. This methodology
effectively captures the inherent uncertainty in the data, thereby enabling the generation of ensemble predictions under identical input conditions by repeatedly sampling from the Gaussian distribution. For better understanding, we draw analogies between these machine learning techniques and the conventional terminology in ensemble weather/subseasonal forecasting. In our model, the static hidden feature forms the basis for deterministic forecasts, while sampling from the Gaussian distribution serves as a perturbation module. This module introduces flow-dependent perturbations into the model’s hidden feature, facilitating the generation of ensemble forecasts.
The FuXi-S2S model, illustrated in Fig. 5a, consists of three primary components: an encoder P , a perturbation module, and a decoder. The encoder, processing predicted weather parameters from two preceding time steps, with each time step representing 1 day, as FuXiS2S is designed to forecast daily mean values. Specifically, it takes and as inputs into a two-dimensional (2D) convolution layer with a kernel size of two, which reduces the dimensions of the input data by half. Following this, the hidden feature (with dimensions of ) is derived from 12 repeated transformer blocks. The input to the encoder is a data cube that combines both upper-air and surface variables, with dimensions of . These dimensions represent two preceding time steps ( and ), the number of input variables, and the latitude ( H ) and longitude ( W ) grid points, respectively. To account for the accumulation of forecast error over time, the forecast lead time ( ) is also included in the encoder’s input. Besides , the encoder also generates a low-rank multivariate Gaussian distribution, , characterized by a mean vector , a covariance matrix , and a diagonal covariance matrix diag . Intermediate perturbation vectors ( , dimension: ) are sampled from this Gaussian distribution ( ). These vectors, after being weighted by a learned weight vector, yield the final perturbation vectors z (dimension: ).
The decoder then processes the perturbed hidden features ( ) through 24 transformer blocks and a fully connected layer, resulting in the final ensemble output . The number of ensemble members generated equals the number of samples drawn from the Gaussian distribution .
The FuXi-S2S model’s training primarily focuses on constructing a Gaussian distribution that accurately represents the uncertainty in the model’s predictions. A significant challenge in this process is the deviation of the Gaussian distribution derived from the model’s predictions from the Gaussian distribution based on the target data, largely attributable to prediction errors. This challenge is addressed through knowledge distillation, which enables the transfer of information from real-world distributions to those predicted by the model. Within this framework, the encoder Q plays a crucial role, converting the target data into a Gaussian distribution. This distribution serves as a supervisor for the distribution generated by the encoder P , aiming to align both distributions closely by minimizing the Kullback-Leibler (KL) divergence loss ( ). This KL loss measures the discrepancy between the distributions predicted by both encoders. As illustrated in the Fig. 5b, during the training phase of the FuXi-S2S model, the encoder Q, which shares the network structure with the encoder P, processes a data cube containing target weather parameters from a preceding and the current time steps: and . It predicts a low-rank multivariate Gaussian distribution similar to the encoder P . Intermediate perturbation vectors are sampled from the encoder Q’s distribution ( ) during training (see Fig. 5b), and from the encoder P’s distribution ( ) during testing (see Fig. 5a). These vectors have dimensions of . Additionally, an L1 loss is computed between the model’s output ( ) and the target . Therefore, the overall loss function at each autoregressive step is thus determined by the following equation:
where , a tune-able coefficient balancing and L 1 , is set to in this study. The design of this loss function serves two purposes: the first term ensures the perturbation vector closely approximates the true data distribution, while the second term ensures the prediction unaffected by any perturbation vectors .
In this study, we employ 51 ensemble members for subseasonal ensemble forecasting. As illustrated in Supplementary Fig. 15, the FuXiS2S model, when enhanced with flow-dependent perturbations incorporated into its hidden features, demonstrates considerably improved forecast performance compared to the FuXi-S2S model that combines Perlin noise in the initial conditions with fixed perturbations added to the hidden features. Notably, the addition of Perlin noise results in only marginal improvements in forecast accuracy when the ensemble size is small. However, with larger ensemble sizes, such as the 51 members in this study, the addition of Perlin noise does not enhance forecast accuracy.
Similar to FuXi, we utilize an autoregressive, multi-step loss function to mitigate cumulative errors over long lead times, as outlined in Lam et al. . The training process follows an autoregressive training regime and a curriculum training schedule, incrementally increasing the number of autoregressive steps from 1 to 17. Each autoregressive step undergoes 1000 gradient descent updates, resulting in a total number of 17,000 training steps. The training process utilizes 8 Nvidia A100 graphics processing units (GPUs), each employing a batch size of 1 . Optimization is performed using the AdamW optimizer with the following parameters: and , an initial learning rate of , and a weight decay coefficient of 0.1. The optimization hyperparameters used for training are summarized in Supplementary Table 1.

Saliency map

Recent developments in the field of XML have led to the emergence of various techniques , including saliency mapping. Saliency mapping quantifies the influence of a model’s input on its output . This method is characterized by the gradient intensities within the saliency maps; areas with higher gradients are considered critical by the model for making accurate predictions.
The generation of saliency maps primarily depends on backward propagation. This differs from standard model training as the propagation target can be adjusted depending on the specific goal of the analysis. Here, the saliency of the predicted anomaly relative to the input data is given by:
where denotes the FuXi-S2S model and is the number of forward steps, while and are the climatological mean and standard deviation, respectively. D specify the geographical area of interest. and represent the input and output variables. A well-trained model is expected to yield a saliency map that aligns well with the established physical understanding of weather systems. In our study, we construct an aggregated saliency map by averaging the individual maps generated from each of the 51 ensemble members.

Evaluation method

Prior to evaluation, each variable in the 42 -day forecasts undergoes a detrending process to eliminate the linear trend. This step is essential for removing the linear long-term trends potentially affected by global warming . For detrending, a linear regression model is fitted to estimate the weekly mean linear trend from both forecasts and observations over the hindcast period (2002-2016). For the testing period (2017-2021), this model takes the week of the year as input data to calculate the trend, which is then subtracted from both the forecasts and observations to obtain the detrended fields. Subsequently, the deterministic metrics of the ensemble mean are evaluated using the latitude-weighted TCC, which is calculated as follows:
where represents the forecast initialization time in the testing dataset , and denote the number of grid points in the latitude and longitude directions. The indices , and correspond to variables, latitude, and longitude coordinates, respectively. refers to the forecast lead time steps added to and are the differences between the forecast or observation and the climatological mean, with the climatological mean derived from data spanning the years from 2002 and 2016.
To evaluate the ensemble forecast performance, we use the RPSS which quantifies the comparison between the cumulative squared probability errors of a given forecast and a climatological forecast. The calculation of the RPSS metric necessitates prior determination of the ranked probability scores (RPS) for both the forecast ( RPS ) and the climatological forecast ( RPS ) should be calculated first. The RPS aggregates the squared probability errors across ( in this work) categories, such as tercile, arranged in ascending order. The tercile bounds are determined based on the average values over either 1-week or 2-week periods for each corresponding verification period. These calculations of tercile bounds are performed
separately for each forecast model and observation (ERA5 data). The metric assesses the accuracy with which the probability forecast predicts the actual observation category. The RPS score is derived from the sum of the squared differences between the cumulative categorical forecast probability and its observed counterpart, where denotes the observed category and represents other categories:
where represent the th components of the cumulative forecast, climatological, and observational distributions, respectively. And , correspond to the forecasted, climatological, and observed probability of the event’s occurrence in category . Crucially, the RPS is affected by both the forecast probabilities attributed to the observed category and the probabilities assigned to other categories. The RPS value varies between 0 and 1 , where a lower value denotes a smaller forecast probability error, and thus a more accurate forecast. Specifically, a RPS value of 0 indicates a perfectly accurate categorical forecast. With the RPS values of both the forecast and the climatological forecast, the RPSS can be determined as:
where the brackets <…> denote the average of the RPS and RPS values across all forecast-observation pairs. Since each forecast category is equally probable by design, the climatological forecast assumes a 33% probability of occurrence for each category. The RPSS metric serves a comparative measure against the climatological forecast. Its value ranges from to 1 , where 1 corresponds to a perfect forecast and higher values suggest better forecast performance. A positive RPSS value indicates superior accuracy over the climatological forecast, while a negative value suggests inferior accuracy. A value of zero suggests that the forecast has no added skill compared to the climatological forecast.
Additionally, we use the BSS to evaluate the performance of extreme forecasts. The BSS, a widely used metric for assessing the quality of categorical probabilistic forecasts, can be considered as a special case of the RPSS with two forecast categories . The BSS is computed using the following equation:
where and represent the Brier Scores (BS) for the model’s forecast and the climatological forecast, respectively. Similar to the RPS, the BS quantifies the mean squared difference between the predicted probabilities and observations (either 0 or 1 ) in binary probabilistic forecasts. In this study, the BSS is calculated for the ensemble mean of both FuXi-S2S and ECMWF S2S, using the 90th climatological percentiles as the threshold for extreme events. The BS ranges from 0 to 1 , with lower values indicating a better agreement between ensemble forecasts and observations with 0 suggesting the best possible BS score. On the contrary, a higher BSS, up to a maximum of 1 , indicates better performance. The BSS measures the improvement of a forecast’s BS ( ) relative to that of a climatological forecast ( ) as reference. A BSS of one indicates a perfect forecast, zero denotes no improvement over
climatology, and negative values suggest inferior performance compared to climatology.
The evolution of MJO is typically characterized using the Real-time Multivariate MJO (RMM) index, as originally developed by Wheeler and Hendon . The RMM1 and RMM2 indices represent the first and second principal components of the combined EOF. This EOF is derived based on the daily mean values of OLR, zonal wind at 850 hPa (U850), and zonal wind at 200 hPa (U200), all averaged within the latitude range of and . In this study, we use the EOFs derived by Wheeler and Hendon (2004) . To obtain the predicted MJO indices, data from both the FuXi-S2S and ECMWF S2S models are firstly interpolated from a spatial resolution of , and projected onto the observed EOFs. After calculating the ensemble mean anomalies, the RMM for the ensemble mean of both modes was derived. The amplitude and phase of the MJO are respectively defined by the formulas: RMMA = and . To assess the quality of the MJO forecasts, we calculate the bivariate COR using the following equation:
where and are the observed RMM1 and RMM2 at time derived from the ERA5 reanalysis dataset. Correspondingly, and represent the forecasts for time with a lead time of days, respectively. denotes the number of total predictions. We apply the threshold of COR for skillful prediction .
Additionally, we assessed the respective contributions of amplitude and phase to the prediction skills of the MJO by examining the COR and error metrics of ensemble mean forecasts for each component. The COR for amplitude ( ) and phase ( ) were calculated using the methods outlined by Wang et al. as follows:
where and represent the observed and predicted amplitudes of the MJO, respectively, while and denote the observed and predicted phases. Additionally, we computed the average amplitude and phase errors (ERROR and ERROR ) as follows, based on the method described by Rashid et al. :
Further details about the COR and ERROR for the amplitude and phase are presented in the Supplementary Fig. 9.
Atmospheric predictability exhibits significant day-to-day variability, which in turn affects the potential accuracy of weather forecasts. To determine whether FuXi-S2S consistently outperforms ECMWF S2S despite this variability, we adopted a bootstrapping approach for significance testing. This method involves generating a large number of synthetic datasets, for example, 1000 in this work. For each day within these datasets, a forecast is randomly selected from either model A or model B. The forecast skill of each synthetic dataset is then evaluated
by comparing it with actual observation. If the performance of model A surpasses the 97.5th percentile of the skill distribution derived from the synthetic datasets, it can be considered “significantly better” than model B. In contrast, if its performance falls below the 2.5th percentile, it is regarded as “significantly worse”. We also analyzed where the FuXiS2S and ECMWF S2S models are significantly better or worse than the climatological forecasts, with model B representing these forecasts. Throughout the paper, significance testing has been applied to all bar plots and spatial maps of statistical metrics. For all the bar plots in the paper, a pale color is used when the FuXi-S2S model does not show a statistically significant improvement over the ECMWF S2S model. Additionally, we have marked areas on all spatial maps where the skill score is statistically significant with stippling.

Data availability

We downloaded a subset of the daily statistics from the ERA5 hourly data from the official website of Copernicus Climate Data (CDS) at https://cds.climate.copernicus.eu/cdsapp#!/software/app-c3s-daily-era5-statistics. The ECMWF S2S data were obtained from https://apps. ecmwf.int/datasets/data/s2s/. The CPC OLR data are provided by the NOAA Physical Sciences Laboratory (PSL) from their website of https:// psl.noaa.gov. Rainfall data from the Global Precipitation Climatology Project (GPCP) was obtained from the National Oceanic and Atmospheric Administration (NOAA), specifically the National Centers for Environmental Information (NCEI), which is accessible at https://www. ncei.noaa.gov/products/global-precipitation-climatology-project. The relevant data from each figure in the main manuscript and in the Supplementary Information are provided in https://zenodo.org/ records/12662702 .

Code availability

The source code employed for training and running FuXi-S2S models in this research is accessible within a specific Google Drive folder (https:// drive.google.com/drive/folders/1z47CRQdKFZaOjtKQWSNZobC1_ RePUVIK?usp=sharing) . As the FuXi-S2S model and code are essential resources for this study. Currently, access to these resources is limited. For inquiries and access to the Google Drive link kindly reach out to Li Hao at the following email address: lihao_lh@fudan.edu.cn. Calculation of MJO index is based on the EOFs derived by Wheeler and Hendon . The implementation of Perlin noise is based on publicly available from the GitHub repository: https://github.com/pvigier/ perlin-numpy.

References

  1. National Academies of Sciences. Next generation earth system prediction: strategies for subseasonal to seasonal forecasts (National Academies Press, Washington, DC, 2016).
  2. White, C. J. et al. Potential applications of subseasonal-to-seasonal (s2s) predictions. Meteorol Appl. 24, 315-325 (2017).
  3. Pegion, K. et al. The subseasonal experiment (subx): a multimodel subseasonal prediction experiment. Bull. Am. Meteorol Soc. 100, 2043-2060 (2019).
  4. White, C. J. et al. Advances in the application and utility of subseasonal-to-seasonal predictions. Bull. Am. Meteorol Soc. 103, E1448-E1472 (2022).
  5. Domeisen, D. I. et al. Advances in the subseasonal prediction of extreme events: relevant case studies across the globe. Bull. Am. Meteorol Soc. 103, E1473-E1501 (2022).
  6. Lorenz, E. N. Forced and free variations of weather and climate. J. Atmos. Sci. 36, 1367 – 1376 (1979).
  7. Mariotti, A., Ruti, P. M. & Rixen, M. Progress in subseasonal to seasonal prediction through a joint weather and climate community effort. NPJ Clim. Atmos. Sci. 1, 4 (2018).
  8. Weyn, J. A., Durran, D. R., Caruana, R. & Cresswell-Clay, N. Subseasonal forecasting with a large ensemble of deep-learning
    weather prediction models. J. Adv. Model. Earth Syst. 13, e2021MSOO2502 (2021).
  9. Han, J.-Y., Kim, S.-W., Park, C.-H. & Son, S.-W. Ensemble size versus bias correction effects in subseasonal-to-seasonal (s2s) forecasts. Geosci. Lett. 10, 37 (2023).
  10. Vitart, F. Evolution of ECMWF sub-seasonal forecast skill scores. Q. J. R. Meteorol Soc. 140, 1889-1899 (2014).
  11. Saha, S. et al. The NCEP climate forecast system version 2. J. Clim. 27, 2185-2208 (2014).
  12. Vitart, F. et al. The subseasonal to seasonal (s2s) prediction project database. Bull. Am. Meteorol Soc. 98, 163-173 (2017).
  13. Nowak, K., Webb, R., Cifelli, R. & Brekke, L. Sub-seasonal climate forecast rodeo. In Proc. 2017 AGU Fall Meeting, 11-15 (New Orleans, LA, 2017).
  14. Monhart, S. et al. Skill of subseasonal forecasts in Europe: Effect of bias correction and downscaling using surface observations. J. Geophys. Res. Atmos. 123, 7999-8016 (2018).
  15. Hwang, J., Orenstein, P., Cohen, J., Pfeiffer, K. & Mackey, L. Improving subseasonal forecasting in the western us with machine learning. In Proc. of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2325-2335 (2019).
  16. Vitart, F. et al. Outcomes of the WMO prize challenge to improve subseasonal to seasonal predictions using artificial intelligence. Bull. Am. Meteorol Soc. 103, E2878-E2886 (2022).
  17. Mouatadid, S. et al. Adaptive bias correction for improved subseasonal forecasting. Nat. Commun. 14, 3482 (2023).
  18. Domeisen, D. I. et al. Advances in the subseasonal prediction of extreme events: relevant case studies across the globe. Bull. Am. Meteorol Soc. 103, 1473-1501 (2022).
  19. Demaeyer, J., Penny, S. G. & Vannitsem, S. Identifying efficient ensemble perturbations for initializing subseasonal-to-seasonal prediction. J. Adv. Model. Earth Syst. 14, 1-30 (2022).
  20. Buizza, R., Milleer, M. & Palmer, T. N. Stochastic representation of model uncertainties in the ECMWF ensemble prediction system. Q. J. R. Meteorol Soc. 125, 2887-2908 (1999).
  21. Buizza, R. Introduction to the special issue on ” 25 years of ensemble forecasting”. Q. J. R. Meteorol Soc. 145, 1-11 (2019).
  22. Leutbecher, M. Ensemble size: How suboptimal is less than infinity? Q. J. R. Meteorol Soc. 145, 107-128 (2019).
  23. Cohen, J. et al. S2s reboot: an argument for greater inclusion of machine learning in subseasonal to seasonal forecasts. Wiley Interdiscip. Rev. Clim. Change 10, e00567 (2019).
  24. Richardson, D. S. Measures of skill and value of ensemble prediction systems, their interrelationship and the effect of ensemble size. Q. J. R. Meteorol Soc. 127, 2473-2489 (2001).
  25. Hu, Y., Chen, L., Wang, Z. & Li, H. SwinVRNN: A data-driven ensemble forecasting model via learned distribution perturbation. J. Adv. Model. Earth Syst. 15, e2022MS003211 (2023).
  26. Kurth, T. et al. FourCastNet: Accelerating Global High-Resolution Weather Forecasting Using Adaptive Fourier Neural Operators. In Proc. of the Platform for Advanced Scientific Computing Conference (2022).
  27. Lam, R. et al. Learning skillful medium-range global weather forecasting. Science 382, eadi2336 (2023).
  28. Bi, K. et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533-538 (2023).
  29. Chen, L. et al. Fuxi: a cascade machine learning forecasting system for 15-day global weather forecast. Npj Clim. Atmos. Sci. 6, 1-11 (2023).
  30. Zhong, X. et al. Fuxi-extreme: improving extreme rainfall and wind forecasts with diffusion model (2023).
  31. Nguyen, T. et al. Scaling transformer neural networks for skillful and reliable medium-range weather forecasting. Preprint at https:// arxiv.org/abs/2312.03876 (2023).
  32. Haiden, T. et al. Evaluation of ECMWF forecasts, including the 2021 upgrade. ECMWF Technical Memorandum No. 884 (European Centre for Medium-Range Weather Forecasts, 2021). https://doi. org/10.21957/90pgicjk4.
  33. Wang, C. et al. Coupled ocean-atmosphere dynamics in a machine learning earth system model. Preprint at https://arxiv.org/abs/ 2406.08632 (2024).
  34. He, S., Li, X., DelSole, T., Ravikumar, P. & Banerjee, A. Sub-seasonal climate forecasting via machine learning: challenges, analysis, and advances. Proc. AAAI Conf. Artif. Intell. 35, 169-177 (2021).
  35. Kiefer, S. M., Lerch, S., Ludwig, P. & Pinto, J. G. Can machine learning models be a suitable tool for predicting central European cold winter weather on subseasonal to seasonal time scales? Artif. Intell. Earth Syst. 2, 1-16 (2023).
  36. Molteni, F., Buizza, R., Palmer, T. N. & Petroliagis, T. The ECMWF ensemble prediction system: Methodology and validation. Q. J. R. Meteorol Soc. 122, 73-119 (1996).
  37. de Andrade, F., Coelho, C. A. & Cavalcanti, I. F. Global precipitation hindcast quality assessment of the subseasonal to seasonal (s2s) prediction project models. Clim. Dyn. 52, 5451-5475 (2019).
  38. Madden, R. A. & Julian, P. R. Detection of a 40-50 day oscillation in the zonal wind in the tropical pacific. J. Atmos. Sci. 28, 702-708 (1971).
  39. Madden, R. A. & Julian, P. R. Description of global-scale circulation cells in the tropics with a 40-50 day period. J. Atmos. Sci. 29, 1109-1123 (1972).
  40. Bach, S. et al. On pixel-wise explanations for non-linear classifier decisions by layer-wise relevance propagation. PLoS ONE 10, e0130140 (2015).
  41. McGovern, A. et al. Making the black box more transparent: understanding the physical implications of machine learning. Bull. Am. Meteorol Soc. 100, 2175-2199 (2019).
  42. Molnar, C., Casalicchio, G. & Bischl, B. Interpretable machine learning-a brief history, state-of-the-art and challenges. In Proc. Joint European conference on machine learning and knowledge discovery in databases, 417-431 (Springer, 2020).
  43. Mamalakis, A., Ebert-Uphoff, I. & Barnes, E. A. Explainable artificial intelligence in meteorology and climate science: Model fine-tuning, calibrating trust and learning new science. In Proc. International Workshop on Extending Explainable AI Beyond Deep Models and Classifiers, 315-339 (Springer, 2020).
  44. Toms, B. A., Kashinath, K. & Yang, D. et al. Testing the reliability of interpretable neural networks in geoscience using the Madden-Julian oscillation. Geosci. Model Dev. 14, 4495-4508 (2021).
  45. Rasp, S. & Thuerey, N. Data-driven medium-range weather prediction with a Resnet pretrained on climate simulations: a new model for Weatherbench. J. Adv. Model. Earth Syst. 13, e2020MS002405 (2021).
  46. Simonyan, K., Vedaldi, A. & Zisserman, A. Deep inside convolutional networks: Visualising image classification models and saliency maps. In Proc. International Conference on Learning Representations (2013).
  47. Dunstone, N. et al. Windows of opportunity for predicting seasonal climate extremes highlighted by the Pakistan floods of 2022. Nat. Commun. 14, 6544 (2023).
  48. Faghmous, J. H. & Kumar, V. A big data guide to understanding climate change: the case for theory-guided data science. Big Data 2, 155-163 (2014).
  49. Karpatne, A. et al. Theory-guided data science: a new paradigm for scientific discovery from data. IEEE Trans. Knowl. Data Eng. 29, 2318-2331 (2017).
  50. Chattopadhyay, A. & Hassanzadeh, P. Long-term instability of deep learning-based digital twins of the climate system: Cause and solution. In Proc. APS March Meeting Abstracts (2023).
  51. Epstein, E. S. A scoring system for probability forecasts of ranked categories. J. Appl. Meteorol 8, 985-987 (1969).
  52. Wilks, D. S. Statistical methods in the atmospheric sciences 3rd edn, Vol. 100 (2011).
  53. Vitart, F. & Robertson, A. W. The sub-seasonal to seasonal prediction project (s2s) and the prediction of extreme events. NPJ Clim. Atmos. Sci. 1, 3 (2018).
  54. Merryfield, W. J. et al. Current and emerging developments in subseasonal to decadal prediction. Bull. Am. Meteorol Soc. 101, E869-E896 (2020).
  55. Zhang, C. Madden-Julian oscillation. Rev. Geophys. 43 (2005).
  56. Zhang, C. Madden-Julian oscillation: bridging weather and climate. Bull. Am. Meteorol Soc. 94, 1849-1870 (2013).
  57. Zhang, C. et al. Cracking the MJO nut. Geophys. Res. Lett. 40, 1223-1230 (2013).
  58. Neena, J. et al. Predictability of the Madden-Julian oscillation in the intraseasonal variability hindcast experiment (ISVHE). J. Clim. 27, 4531-4543 (2014).
  59. Kim, H., Vitart, F. & Waliser, D. E. Prediction of the Madden-Julian oscillation: a review. J. Clim. 31, 9425-9443 (2018).
  60. Jiang, X. et al. Fifty years of research on the madden-julian oscillation: Recent progress, challenges, and perspectives. J. Geophys. Res. Atmos. 125, e2019JDO30911 (2020).
  61. Wu, J. & Jin, F.-F. Improving the MJO forecast of s2s operation models by correcting their biases in linear dynamics. Geophys. Res. Lett. 48, 1-10 (2021).
  62. Silini, R. et al. Improving the prediction of the Madden-Julian oscillation of the ECMWF model by post-processing. Earth Syst. Dyn. 13, 1157-1165 (2022).
  63. Kim, H., Ham, Y. G., Joo, Y. S. & Son, S. W. Deep learning for bias correction of MJO prediction. Nat. Commun. 12, 3087 (2021).
  64. Silini, R., Barreiro, M. & Masoller, C. Machine learning prediction of the Madden-Julian oscillation. NPJ Clim. Atmos. Sci. 4, 57 (2021).
  65. Delaunay, A. & Christensen, H. M. Interpretable deep learning for probabilistic MJO prediction. Geophys. Res. Lett. 49, e2022GL098566 (2022).
  66. Wheeler, M. C. & Hendon, H. H. An all-season real-time multivariate MJO index: development of an index for monitoring and prediction. Mon. Weather Rev. 132, 1917-1932 (2004).
  67. Wallace, J. M. & Gutzler, D. S. Teleconnections in the geopotential height field during the northern hemisphere winter. Mon. Weather Rev. 109, 784-812 (1981).
  68. Mo, K. C. & Ghil, M. Statistics and dynamics of persistent anomalies. J. Atmos. Sci. 44, 877-902 (1987).
  69. Zhu, B. & Wang, B. The 30-60-day convection seesaw between the tropical Indian and western Pacific oceans. J. Atmos. Sci. 50, 184-199 (1993).
  70. Walker, G. T. Correlations in seasonal variations of weather. viii, a further study of world weather. Men. Indian Meteor. Dept. 24, 275-332 (1924).
  71. Huang, R. H. Influence of the heat source anomaly over the western tropical Pacific for the subtropical high over East Asia. In Proc. International Conference on the General Circulation of East Asia. Chendu, China, April 10-15, 1987, 40-50 (1987).
  72. Savarin, A. & Chen, S. S. Pathways to better prediction of the MJO: 2. impacts of atmosphere-ocean coupling on the upper ocean and MJO propagation. J. Adv. Model. Earth Syst. 14, e2021MS002929 (2022).
  73. Hong, C.-C. et al. Causes of 2022 Pakistan flooding and its linkage with China and Europe heatwaves. NOJ Clim. Atmos. Sci. 6, 163 (2023).
  74. Yang, R. et al. Interpretable machine learning for weather and climate prediction: a survey. Preprint at https://arxiv.org/abs/2403. 18864 (2024).
  75. Haiden, T. et al. Evaluation of ECMWF forecasts, including the 2018 upgrade. ECMWF Technical Memorandum No. 831 (European
Centre for Medium-Range Weather Forecasts, 2018). https://doi. org/10.21957/ldw15ckqi.
76. Nogueira, M. Inter-comparison of era-5, era-interim and GPCP rainfall over the last 40 years: process-based analysis of systematic and random differences. J. Hydrol. 583, 1-17 (2020).
77. Lavers, D. A., Simmons, A., Vamborg, F. & Rodwell, M. J. An evaluation of era5 precipitation for climate monitoring. Q. J. R. Meteorol. Soc. 148, 3152-3165 (2022).
78. Hersbach, H. et al. The era5 global reanalysis. Q. J. R. Meteorol Soc. 146, 1999-2049 (2020).
79. Adler, R. F. et al. The global precipitation climatology project (GPCP) monthly analysis (new version 2.3) and a review of 2017 global precipitation. Atmosphere 9, 138 (2018).
80. Albers, J. R. & Newman, M. Subseasonal predictability of the North Atlantic oscillation. Environ. Res. Lett. 16, 1-10 (2021).
81. Yan, Y., Liu, B. & Zhu, C. Subseasonal predictability of South China Sea summer monsoon onset with the ECMWF s2s forecasting system. Geophys. Res. Lett. 48, e2021GL095943 (2021).
82. Richter, J. H. et al. Quantifying sources of subseasonal prediction skill in cesm2. NPJ Clim. Atmos. Sci. 7, 59 (2024).
83. Stan, C. et al. Advances in the prediction of MJO teleconnections in the s2s forecast systems. Bull. Am. Meteorol Soc. 103, E1426-E1447 (2022).
84. Cho, K., Van Merriënboer, B., Bahdanau, D. & Bengio, Y. On the properties of neural machine translation: Encoder-decoder approaches. In Proc. of SSST 2014 – 8th Workshop on Syntax, Semantics and Structure in Statistical Translation (2014).
85. Olivetti, L. & Messori, G. Advances and prospects of deep learning for medium-range extreme weather forecasting. EGUsphere 2023, 1-20 (2023).
86. Doersch, C. Tutorial on variational autoencoders. Preprint at https:// arxiv.org/abs/1606.05908 (2016).
87. Zhao, T., Zhao, R. & Eskenazi, M. Learning discourse-level diversity for neural dialog models using conditional variational autoencoders. Preprint at https://arxiv.org/abs/1703.10960 (2017).
88. Kingma, D. P. & Welling, M. An introduction to variational autoencoders. Found. Trends Mach. Learn. 12, 307-392 (2019).
89. Kingma, D. P. & Ba, J. Adam: A method for stochastic optimization. In Proc. International Conference on Learning Representations (2015).
90. Loshchilov, I. & Hutter, F. Decoupled weight decay regularization. In Proc. International Conference on Learning Representations (2017).
91. Samek, W., Wiegand, T. & Müller, K.-R. Explainable artificial intelligence: Understanding, visualizing and interpreting deep learning models. Preprint at https://arxiv.org/abs/1708.08296 (2017).
92. Weirich-Benet, E. et al. Subseasonal prediction of central European summer heatwaves with linear and random forest machine learning models. Artif. Intell. Earth Syst. 2, e220038 (2023).
93. Weigel, A. P., Liniger, M. A. & Appenzeller, C. The discrete brier and ranked probability skill scores. Mon. Weather Rev. 135, 118-124 (2007).
94. Brier, G. W. Verification of forecasts expressed in terms of probability. Mon. Weather Rev. 78, 1 (1950).
95. Rashid, H. A., Hendon, H. H., Wheeler, M. C. & Alves, O. Prediction of the Madden-Julian oscillation with the Poama dynamical prediction system. Clim. Dyn. 36, 649-661 (2011).
96. Wang, S., Sobel, A. H., Tippett, M. K. & Vitart, F. Prediction and predictability of tropical intraseasonal convection: Seasonal dependence and the maritime continent prediction barrier. Clim. Dyn. 52, 6015-6031 (2019).
97. Chen, L. et al. A machine learning model that outperforms conventional global subseasonal forecast models (Version 1.0) [Figure Dataset]. Zenodo. (2024). https://zenodo.org/records/12662702.
98. Chen, L. et al. A machine learning model that outperforms conventional global subseasonal forecast models (Version 1.0) [Dataset] [Software]. Zenodo. (2023). https://zenodo.org/records/ 10402083.

Acknowledgements

This work was supported by the National Key R&D Program of China under Grant 2021YFA0718000, the National Natural Science Foundation of China under Grant 42175052, and the China Meteorological Administration (CMA) Youth Innovation Team (CMA2O24QNO6. We extend our sincere gratitude to the researchers at ECMWF for their invaluable contributions to the collection, archival, dissemination, and maintenance of the ERA5 reanalysis dataset and ECMWF S2S reforecast and real-time forecast data.

Author contributions

H.L., X.Z, L.C., and B.L. designed the project. L.C. designed and performed the model training. X.Z. and L.C. performed the analysis under supervision of H.L., B.L., J.W., Q.C., L.W., C.L., Z.H., and Y.Q. X.Z. and L.C. wrote and revised the manuscript. J.W., D.C., and S.X. contributed to interpreting results and discussions of associated dynamics.

Competing interests

The authors declare no competing interests.

Additional information

Supplementary information The online version contains supplementary material available at https://doi.org/10.1038/s41467-024-50714-1.
Correspondence and requests for materials should be addressed to Hao Li, Bo Lu or Yuan Qi.
Peer review information Nature Communications thanks Hannah Christensen and the other, anonymous, reviewers for their contribution to the peer review of this work. A peer review file is available.
Reprints and permissions information is available at http://www.nature.com/reprints
Publisher’s note Springer Nature remains neutral with regard to jurisdictional claims in published maps and institutional affiliations.
Open Access This article is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License, which permits any non-commercial use, sharing, distribution and reproduction in any medium or format, as long as you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons licence, and indicate if you modified the licensed material. You do not have permission under this licence to share adapted material derived from this article or parts of it. The images or other third party material in this article are included in the article’s Creative Commons licence, unless indicated otherwise in a credit line to the material. If material is not included in the article’s Creative Commons licence and your intended use is not permitted by statutory regulation or exceeds the permitted use, you will need to obtain permission directly from the copyright holder. To view a copy of this licence, visit http:// creativecommons.org/licenses/by-nc-nd/4.0/.
(c) The Author(s) 2024

  1. (v) Check for updates
  2. Artificial Intelligence Innovation and Incubation Institute, Fudan University, Shanghai, China. Shanghai Academy of Artificial Intelligence for Science, Shanghai, China. China Meteorological Administration Key Laboratory for Climate Prediction Studies, National Climate Center, Beijing, China. Xiong’an Institute of Meteorological Artificial Intelligence, Xiong’an, China. University of Gothenburg, Gothenburg, Sweden. Scripps Institution of Oceanography, University of California San Diego, San Diego, CA, USA. School of Data Science, Fudan University, Shanghai, China. Institute for Big Data, Fudan University, Shanghai, China. MOE Laboratory for National Development and Intelligent Governance, Fudan University, Shanghai, China. These authors contributed equally: Lei Chen, Xiaohui Zhong, Hao Li, Jie Wu. e-mail: lihao_lh@fudan.edu.cn; bolu@cma.gov.cn; qiyuan@fudan.edu.cn