تنبؤ المناخ الشهري باستخدام الشبكة العصبية التلافيفية العميقة وذاكرة المدى القصير والطويل Monthly climate prediction using deep convolutional neural network and long short-term memory

المجلة: Scientific Reports، المجلد: 14، العدد: 1
DOI: https://doi.org/10.1038/s41598-024-68906-6
PMID: https://pubmed.ncbi.nlm.nih.gov/39085577
تاريخ النشر: 2024-07-31

تنبؤ المناخ الشهري باستخدام الشبكة العصبية التلافيفية العميقة وذاكرة المدى القصير والطويل

تشينغتشون قوه , زينفانغ & زهاوشينغ وانغ

الملخص

تؤثر تغيرات المناخ على نمو النباتات وإنتاج الغذاء والأنظمة البيئية والتنمية الاجتماعية والاقتصادية المستدامة وصحة الإنسان. تم اقتراح نماذج الذكاء الاصطناعي المختلفة لمحاكاة معلمات المناخ في مدينة جينان في الصين، بما في ذلك الشبكة العصبية الاصطناعية (ANN) والشبكة العصبية المتكررة (RNN) والشبكة العصبية للذاكرة القصيرة والطويلة (LSTM) والشبكة العصبية التلافيفية العميقة (CNN) وCNN-LSTM. تُستخدم هذه النماذج للتنبؤ بستة عوامل مناخية على أساس شهري. تشمل بيانات المناخ لمدة 72 عامًا (من 1 يناير 1951 إلى 31 ديسمبر 2022) المستخدمة في هذه الدراسة متوسط درجة الحرارة الجوية الشهرية ودرجة الحرارة الجوية القصوى الدنيا ودرجة الحرارة الجوية القصوى العليا وهطول الأمطار ومتوسط الرطوبة النسبية وساعات الشمس. تُستخدم سلسلة زمنية من بيانات متأخرة لمدة 12 شهرًا كإشارات إدخال للنماذج. يتم فحص كفاءة النماذج المقترحة باستخدام معايير تقييم متنوعة وهي متوسط الخطأ المطلق وجذر متوسط مربع الخطأ (RMSE) ومعامل الارتباط (R). تشير نتائج النمذجة إلى أن نموذج CNN-LSTM الهجين المقترح يحقق دقة أكبر من النماذج المقارنة الأخرى. يقلل نموذج CNN-LSTM الهجين بشكل كبير من خطأ التنبؤ مقارنة بالنماذج للخطوة الزمنية لشهر واحد. على سبيل المثال، فإن قيم RMSE لنماذج ANN وRNN وLSTM وCNN وCNN-LSTM لدرجة الحرارة الجوية الشهرية المتوسطة في مرحلة التنبؤ هي و , على التوالي. تُظهر نتائج محاكاة المناخ إمكانيات نماذج CNN-LSTM لتحسين التنبؤ بالمناخ. سيساهم التنبؤ بالمناخ في الوقاية من الكوارث الجوية وتقليلها، بالإضافة إلى التحكم في الفيضانات ومقاومة الجفاف.

تؤثر تغيرات المناخ على تطوير التربة ونمو النباتات وأمن الغذاء وسلامة المياه وجودة الهواء وسلامة المرور والسياحة والإنتاج الزراعي وحرائق الغابات والفيضانات والأنظمة البيئية ومصادر الطاقة المتجددة وإدارة الطاقة والتنمية الاجتماعية والاقتصادية المستدامة وصحة الإنسان. . خاصة، تؤدي أحداث الأمطار ودرجات الحرارة القصوى غالبًا إلى كوارث خطيرة مثل الجفاف والانهيارات الطينية والفيضانات. . تؤثر تغيرات المناخ سلبًا على إنتاجية المحاصيل. . كما أن تغير المناخ هو العامل الرئيسي في النمو السنوي للأشجار. يقلل زيادة نمو الأشجار مع زيادة درجة الحرارة القصوى اليومية، ولكنه يزيد مع زيادة الرطوبة النسبية. . متوسط درجة الحرارة الجوية العالمية السنوية في عام 2023 هو أعلى من المستويات ما قبل الصناعية (1850-1900). علاوة على ذلك، فإن متوسط درجة الحرارة الجوية من 2014 إلى 2023 هو أعلى من درجة الحرارة (1850-1900) (منظمة الأرصاد الجوية العالمية). يهدف اتفاق باريس إلى السيطرة على ارتفاع متوسط درجة الحرارة العالمية ليكون أقل من المستويات ما قبل الصناعية بحلول ، ويسعى للحد من ارتفاع درجة الحرارة إلى ما دون . إذا قلل البشر بشكل كبير من انبعاثات غازات الدفيئة وتسارعوا نحو الحياد الكربوني، لا يزال لدينا القدرة على تجنب أسوأ كوارث المناخ. في الوقت نفسه، تساهم التنبؤات المناخية القوية على المدى الطويل في صياغة سياسات إدارة المناخ. مقارنة بالتنبؤات الموسمية، فإن التنبؤ بمتوسطات شهرية بمهارة له أهمية اجتماعية كبيرة، ويمكن دمج المعلومات التنبؤية في قرارات حساسة زمنياً، مثل الممارسات الزراعية والحضرية وإدارة الطاقة والسدود. . ومع ذلك، فإن التنبؤات الحالية لنموذج المناخ ليست مرضية بعد. . لذلك، فإن التنبؤ الدقيق بالمناخ هو
قضية علمية عاجلة تحتاج إلى معالجة. يُوصف نطاق الوقت الفرعي، الذي يتراوح من حوالي أسبوعين إلى ثلاثة أشهر، غالبًا بأنه “صحراء قابلة للتنبؤ” بسبب نقص المهارات التنبؤية.
تم تطبيق نماذج الذكاء الاصطناعي (AI) على نطاق واسع في مجالات متعددة التخصصات. . مع تعميق البحث، أصبحت نماذج الذكاء الاصطناعي قادرة على استكشاف سياق السلاسل الزمنية وتم إدخالها في نمذجة المناخ. . توفر نماذج التعلم الآلي (ML) منظورًا جديدًا لتنبؤ المناخ. . تم تعديل الشبكات العصبية الاصطناعية (ANN) والشبكات العصبية المتكررة (RNN) للتنبؤ بدرجة حرارة الهواء الخارجية في أربع مدن أوروبية. تُستخدم الشبكات العصبية الاصطناعية لتقدير هطول الأمطار في الأمازون القانونية البرازيلية. . تؤكد مقارنة درجة الحرارة الجوية المقاسة والمتنبأ بها التدريب الدقيق للشبكات العصبية. . تتمتع الشبكات العصبية الاصطناعية بعمومية غير خطية وقدرة تنبؤية. . يتم استخدام خوارزمية التعلم العميق للتنبؤ بظاهرة النينيو- oscillation الجنوبية (ENSO). عند التقدم لمدة ستة أشهر، فإن أداء التعلم العميق أفضل بكثير من النماذج المتعددة. . تُستخدم نماذج الشبكات العصبية العميقة (DL) للتقليل الإحصائي. . يمكن أن تتعلم الذاكرة القصيرة والطويلة (LSTM) العلاقات غير الخطية مع الاعتماد على المدى الطويل، وهو ما قد يكون صعبًا على نماذج التعلم الآلي التقليدية والشبكات العصبية التقاطه. . تم تطوير LSTM التلافيفية للتنبؤ بهطول الأمطار. . مهارة الارتباط لمؤشر نينو3.4 لنموذج الشبكات العصبية التلافيفية (CNN) أعلى من تلك الخاصة بأنظمة التنبؤ الديناميكية الحالية. . يمكن أن تتنبأ CNN بدقة أكبر بارتفاعات العواصف المستقبلية. . لقد وُجد أن CNN لديها القدرة على استخراج المعلومات المكانية من التنبؤات عالية الدقة. لقد تم تطبيقها بنجاح للتنبؤ بهطول الأمطار ونصف قطر رياح الأعاصير الاستوائية. . يتم استخدام نموذج MTL-NET للتنبؤ بالقطب الهندي (IOD). يمكن أن يتنبأ MTL-NET بالـ IOD قبل سبعة أشهر، متفوقًا على معظم نماذج المناخ الديناميكية. يحتوي نموذج التعلم المتعدد المهام (MTL-NET) على أربع طبقات تلافيفية وطبقتين من التجميع الأقصى وطبقة LSTM. . تُستخدم نماذج ConvLSTM وU-Net للتنبؤ بموجات الحرارة البحرية (MHWs) في منطقة بحر الصين الجنوبي (SCS). يوفر نظام التنبؤ المبتكر تنبؤات أفضل لـ . تم اعتماد شبكة التنبؤ بهطول الأمطار عبر الشبكات العصبية الهيبرغرافية (PN-HGNN) لأول مرة لتنبؤات هطول الأمطار. . تدمج الطريقة الاحتمالية (DEUCE) الشبكات العصبية البايزية وU-Net لتنبؤ هطول الأمطار. . تم اقتراح التعلم الآلي غير المتغير المناخي للتنبؤ بالمناخ. . تُستخدم شبكة المشغل العميق الكامنة (L-DeepONet) للتنبؤ بالطقس والمناخ. . تُستخدم GCN-GRU (شبكة التلافيف البيانية ووحدة التكرار المغلقة) للتنبؤ برؤية الطقس. . ومع ذلك، لا يزال إنشاء نماذج ذكاء اصطناعي قوية للتنبؤ بالمناخ مهمة صعبة حيث لا يزال هناك فهم غير واضح لبيانات المناخ.
باختصار، يمكن استخدام الذكاء الاصطناعي للتنبؤ بمتغيرات المناخ وقد تم تقييم أدائه التنبؤي. لقد حقق نموذج LSTM، كطريقة ذكاء اصطناعي، أيضًا تقدمًا معينًا في التنبؤ بعوامل المناخ. تُعتبر CNN واحدة من أكثر هياكل الشبكات تمثيلاً في التعلم العميق. مقارنةً بأساليب التعلم العميق الأخرى، تتمتع CNN بقدرات أقوى في استخراج الميزات والتنقيب عن المعلومات. يمكن أن يجمع دمج CNN وLSTM بشكل أكثر فعالية بين الميزات المكانية والزمنية من بيانات الإدخال. تُظهر النتائج التجريبية أن نموذج CNN-LSTM المدمج لديه دقة تنبؤ أفضل من نماذج LSTM وCNN المستقلة. . يتم استخدام طرق ANN وRNN وLSTM وCNN المختلفة للتنبؤ بعوامل المناخ. ومع ذلك، فإن المقارنة بين نتائج التنبؤ بعناصر المناخ المتعددة لنماذج الذكاء الاصطناعي (ANN وRNN وLSTM وCNN وCNN-LSTM) في مدينة جينان ليست واضحة. أجرت هذه الدراسة استكشافات وتجارب متعمقة للعثور على أفضل نموذج لمحاكاة المناخ. في هذه المقالة، نستخدم مجموعة من مجموعات بيانات المناخ لإظهار أن نموذج CNN-LSTM الهجين هو نظام فعال لتنبؤ المناخ ويمكن تطبيقه على مشاكل التنبؤ بالمناخ المختلفة من حيث المبدأ.
في هذه الدراسة، تم تطبيق CNN-LSTM للتنبؤ بسلاسل الزمن المناخية. تم اختبار النظام الهجين المقترح CNN-LSTM بشكل رئيسي في مدينة جينان للتنبؤ بالعوامل المناخية الشهرية. يتم تناول القضايا البحثية التالية: (1) ما هي مهارات طريقة CNN-LSTM الهجينة مقارنة بأساليب ANN التقليدية؟ (2) ما هي المعلمات الفائقة لنموذج CNN-LSTM الهجين؟ (3) هل الحل الهجين CNN-LSTM له أهمية عملية في شرق الصين؟ من خلال الإجابة على هذه الأسئلة، يهدف المؤلف إلى تطوير تنبؤات مناخية أكثر كفاءة وإدخال طرق الذكاء الاصطناعي في التنبؤ المناخي على نطاق أوسع، مما يلهم العمل الإبداعي في المستقبل.

منطقة الدراسة والبيانات
section*{منطقة الدراسة}

تقع جينان في شرق الصين، في وسط شاندونغ، وعلى الحافة الجنوبية الشرقية من سهل شمال الصين (الشكل 1). تنتمي جينان إلى منطقة المناخ الموسمي القاري. تمتلك جينان موارد زراعية ممتازة وتاريخ طويل في زراعة الخضروات، مما أكسبها سمعة “سلة الخضار عالية الجودة في الصين”. في عام 2022، بلغ إجمالي قيمة الإنتاج الزراعي 52.6 مليار يوان، مع إجمالي إنتاج الحبوب 2.962 مليون طن. أكملت جينان تشجير 773.3 هكتار ورعاية الغابات لـ 5333.3 هكتار، مع أكثر من 60 عائلة وأكثر من 300 نوع من موارد الأشجار والشجيرات.

البيانات وتوحيد البيانات

تم الحصول على بيانات المناخ الشهرية خلال الفترة من 1951-2022 في مدينة جينان من المنصة الجوية (http://www.nmic.cn/). تشمل بيانات المناخ الشهرية متوسط درجة حرارة الجو (AT)، الحد الأدنى المطلق لدرجة حرارة الجو، الحد الأقصى المطلق لدرجة حرارة الجو، هطول الأمطار ، متوسط الرطوبة النسبية (RH)، وساعات الشمس (SH).
تم تقسيم مجموعات البيانات المناخية إلى ثلاثة أقسام للتدريب (التدريب) ( ) (من يناير 1951 إلى أكتوبر 2008)، والتحقق (10%) (من نوفمبر 2008 إلى نوفمبر 2015)، والاختبار (التنبؤ) (10%) (من ديسمبر 2015 إلى ديسمبر 2022). ثم، يتم توحيد مجموعات الأقسام الثلاثة لضمان التناسق بين البيانات المناخية. يساعد ذلك في تحسين دقة التنبؤ لنماذج الذكاء الاصطناعي. في مرحلة التدريب، يتم تعيين القيم المثلى للمعلمات لنماذج الذكاء الاصطناعي. في
الشكل 1. خريطة موقع منطقة البحث. تم إنشاء الخريطة باستخدام ArcGIS Pro 2.5 (ArcGIS Pro)، URL: https://www.esriuk.com.
خلال فترة التنبؤ، يتم تقديم البيانات الموحدة إلى الشبكات للتنبؤ بالمناخ. في مرحلة التنبؤ، يتم التنبؤ بدقة بالعناصر المناخية بواسطة النماذج.
من أجل تحسين سرعة تدريب نماذج الذكاء الاصطناعي ودقة التنبؤ، يحتاج الأمر إلى توحيد بيانات المناخ وتوحيد نطاق قيمها بين 0 و . الصيغة هي كما يلي:
حيث، هي بيانات المناخ الموحدة، تمثل -th قيمة من بيانات المناخ الأصلية، تعبر عن القيمة القصوى من تسلسل المناخ، Lmin تعبر عن القيمة الدنيا من تسلسل المناخ.

المنهجية

الشبكة العصبية الاصطناعية (ANN)

تتكون شبكة ANN ذات الثلاث طبقات من طبقة إدخال واحدة، وطبقة مخفية واحدة وطبقة إخراج واحدة (الشكل 2). ترتبط الخلايا العصبية الاصطناعية (العقد) في كل طبقة من BPANN ارتباطًا وثيقًا بالعقد في الطبقات الأخرى .
يتم تقدير قيمة الإخراج لكل طبقة بواسطة المعادلة التالية:
حيث هو الإخراج من العقدة i؛ f تعني دالة التنشيط (دالة النقل)؛ a هو عدد العقد؛ Wij تمثل الوزن؛ Xj و bt هو إدخال الخلية العصبية j وعتبة العقد.
يتم حساب الخطأ بناءً على المخرجات المتوقعة والمتوقعة. يتم حساب متوسط مربع الخطأ (MSE) لـ ANN باستخدام المعادلة:
حيث و Kg هما على التوالي عدد بيانات المناخ التدريبية، والإخراج المتوقع والفعلي للعينة g، والإخراج الفعلي للعينة g.
الشكل 2. هيكل نموذج ANN.
أربعة أنواع من دوال التنشيط (دوال النقل) هي عادة logsig (Sigmoid) في المعادلة (4)، purelin في المعادلة (5)، tansig (tanh) في المعادلة (6) و Rectified Linear Unit (ReLU، أو دالة النقل الخطية الإيجابية (poslin)) في المعادلة (7)، على التوالي.
بعد تدريب النموذج والتحقق منه، تم تحديد إعدادات النموذج. المتغيرات المدخلة هي 12، المتغير الناتج هو 1، وعدد خلايا الطبقة المخفية هو 5. دوال التنشيط هي logsig و purelin، وخوارزمية التدريب هي trainbr. معدل التعلم هو 0.001، وعدد الدورات هو 100 والهدف هو .

الشبكة العصبية التكرارية (RNN)

فقدان الذاكرة هو العيب الرئيسي للشبكات العصبية الاصطناعية ذات التغذية الأمامية. للتغلب على هذا القيد، تدمج الشبكات العصبية التكرارية (RNNs) الاتصالات الراجعة في هيكلها . تستخدم RNNs حالة داخلية لحل التنبؤ بسلاسل الزمن المناخية المتسلسلة.
نقل المعلومات من خلية عصبية إلى أخرى. على سبيل المثال، الحالة المخفية الأخيرة والمدخلات الأخيرة تعطي الحالة المخفية الأخيرة في المعادلة (8). الناتج الأخير يستخرج الميزات من في المعادلة (9) .
حيث هي الأوزان، و و هي التحيزات.
وبالمثل، يتم تعيين معلمات النموذج. المتغيرات المدخلة هي 12، المتغير الناتج هو 1، وعدد خلايا الطبقة المخفية هو 8. دوال التنشيط هي tansig للطبقة المخفية و purelin لطبقة الإخراج. وظيفة التدريب هي trainlm. وظيفة التعلم هي learngdm. وظيفة الأداء mse هي .

شبكة الذاكرة طويلة وقصيرة المدى (LSTM)

LSTM هي الطريقة الأكثر شعبية في التنبؤ المناخي، وتستخدم لمعالجة قضايا الاعتماد على المدى الطويل في RNN. علاوة على ذلك، يمكن لـ LSTM التقاط الميزات غير الخطية في بيانات المناخ بشكل أوسع من خلال ثلاثة أبواب. يمكن تدريب LSTM باستخدام بيانات المناخ للتنبؤ بتغير المناخ. تحدد بوابة الإدخال مقدار المدخلات التي يمكن تخزينها في وحدة الذاكرة. تتحكم بوابة النسيان في مقدار بيانات المناخ من وحدة الذاكرة الأخيرة التي يجب التخلص منها. تحدد بوابة الإخراج مقدار الإخراج من وحدة الذاكرة. تعمل هذه الأبواب معًا لتنظيم بيانات المناخ وتساعد LSTM في التقاط ومعالجة الاعتماد على المدى الطويل في بيانات المناخ. من خلال استخدام أبواب متعددة لتصفية بيانات المناخ، تتم معالجة الذاكرة القصيرة ( ) والذاكرة الطويلة ( ) لذلك، يمكن لـ LSTM استرجاع البيانات على مقاييس زمنية متنوعة، مما يجعلها مناسبة للتنبؤ بالمناخ .
يوضح الشكل 3 الإطار الهيكلي لوحدة LSTM. تتكون مدخلات الوحدة من المعلومات المناخية ، والحالة المخفية للوحدة السابقة وحالة الوحدة السابقة . تشمل مخرجات الوحدة الحالة المخفية وحالة الوحدة ، والتي يتم تنظيمها بواسطة بوابة النسيان ، وبوابة الإدخال ، وبوابة الإخراج . يتم حساب الدورة التنظيمية ومخرجات الوحدة كما يلي:
حيث و هما معامل (الوزن) ومتجه التحيز.
وبالمثل، يتم تعيين المعلمات الفائقة للنموذج. حجم المدخلات هو 12، وعدد المخرجات هو 1، وعدد الوحدات المخفية هو 100. دوال التنشيط هي tanh و sigmoid. يتم استخدام محسن آدم ومعدل التعلم محدد إلى 0.001. الهدف هو .
الشكل 3. هيكل منطق الوحدة لشبكة LSTM.

الشبكة العصبية التلافيفية (CNN)

تتضمن CNN حسابات تلافيفية ولها هيكل عميق (الشكل 4). مقارنةً بـ ANNs، فإن ميزة CNN هي أنها يمكن أن تحسن القدرة على استخراج الميزات المدخلة من خلال زيادة العمق. تشمل خطوات تشغيل CNN: (أ) بعد إدخال البيانات في CNN، يتم استخراج عدد كبير من الميزات وتقليل الأوزان من خلال عدة عمليات تلافيفية وتجميع؛ (ب) تحويل الميزات إلى نتائج انحدار للعقد من خلال طبقة متصلة بالكامل؛ (ج) تستخدم CNN آلية إعادة توزيع لتعيين نفس الأوزان لخلايا عصبية مختلفة، مما يقلل من عدد المعلمات . لمعالجة المدخلات من خلال الطبقات، والخلايا العصبية، ودوال التنشيط، يتم استخدام ReLU. تُستخدم تقنيات التوحيد لتجنب الإفراط في التكيف. يتم استخدام محسن آدم ومعدل التعلم محدد إلى 0.001. الهدف هو . عدد دورات تدريب المعلمات هو 200. أحجام الدفعات هي 20.

CNN-LSTM

تصف الشكل 5 عملية محاكاة المناخ باستخدام CNN-LSTM. تعتبر مشاركة الوزن والحقول الاستقبالية المحلية من الطرق التي يتعلم بها CNN ميزات بيانات المناخ. يتم استخراج الخصائص الناتجة عن كل خطوة زمنية في نماذج LSTM من خلال آلية البوابة. لا تقتصر الطبقة المتصلة بالكامل لتوزيع الزمن على الحصول على ناتج الخطوة الزمنية الأخيرة فحسب، بل تحصل أيضًا على ناتج جميع الخطوات الزمنية. على هذه الأساس، تقدم هذه المقالة نظام انحدار لنمذجة المناخ باستخدام شبكات CNN وLSTM.
يتم تغذية هذا النموذج المقترح من CNN-LSTM مباشرة ببيانات المناخ ثلاثية الأبعاد، وشكله هو في الطبقة التلافيفية الأولى، أشكال نوى التلافيف هي وخطوة التقدم هي 1، مما يسمح باستخراج الميزات المجردة من بيانات المناخ. في الطبقة الثانية (طبقة التجميع الأقصى)، تكون أشكالها وخطوتهم 1. الطبقتان الثالثة والرابعة هما على التوالي تطبيع الدفعات وReLU. في الطبقة التلافيفية 2، 32 نواة بحجم لتقليل حجم مصفوفة الميزات، تم اتباع طبقة تجميع قصوى، والتي لها حجم
الشكل 4. مخطط الهيكل الأساسي لشبكة CNN.
الشكل 5. بنية CNN-LSTM.
من مع خطوة واحدة. يتم استخدام طبقة LSTM واحدة في النموذج. تحتوي LSTM على 100 خلية عصبية. يتم تحويل طبقات LSTM إلى الميزات باستخدام طبقة متصلة بالكامل. أخيرًا، يتم استخدام طبقة انحدار للتنبؤ بالعناصر المناخية. عدد دورات التدريب هو 200. حجم الدفعات هو 20. معدل التعلم هو 0.005، ويتم استخدام مُحسِّن آدم.

تجربة

التحقق المتقاطع

يتم استخدام التحقق المتقاطع بخمسة أضعاف لتجنب الإفراط في التكيف. يتم استخدام بيانات المناخ للتحقق للتدريب والتحقق من جزء إلى آخر. يتم تقسيم البيانات إلى خمسة أجزاء. تتكرر عملية الطي خمس مرات. في الطي الأول، يتم استخدامه للتحقق و للتدريب. وبالمثل، في الطية الثانية، يتم استخدامه للتحقق. لذلك، من خلال طي بيانات المناخ، يتم منع الإفراط في التكيف لنماذج الذكاء الاصطناعي. لأنه يستخدم بيانات مناخ تدريب مختلفة في كل مرة، فإنه لا يميل نحو بيانات مناخ التدريب. لذلك، يمكن منع مشاكل الإفراط في التكيف. .

معايير التقييم

يتم إجراء تقييم الأداء للنماذج المختلفة من خلال مقارنة الفروق بين القيم المناخية المرصودة والمحاكاة. يتم استخدام مقاييس المعلمات المختلفة وهي معامل ارتباط بيرسون (R) ، وجذر متوسط مربع الخطأ (RMSE) ، ومتوسط الخطأ المطلق (MAE). يتم تطبيق الطرق المختلفة مثل الشبكات العصبية الاصطناعية (ANN) ، والشبكات العصبية التكرارية (RNN) ، و LSTM ، و CNN ، و CNN-LSTM لتحقيق أداء عالٍ. حسابات R و RMSE و MAE في المعادلات التالية.
حيث Lm هو قيمة بيانات المناخ الملاحظة، وOm هو القيمة المتوقعة للمناخ، وI هو طول بيانات المناخ. هو متوسط بيانات المناخ الملاحظة، يمثل متوسط القيم المناخية المتوقعة.

محاكاة متوسط درجة حرارة الغلاف الجوي الشهري

تتمتع النماذج بهيكل “مدخل-مخرج”، حيث يكون المخرج عنصرًا مناخيًا لـ الشهر والمدخلات هي عناصر مناخية في t و t – s للأشهر السابقة. من خلال التحليل الدوري، تكون دورة عوامل المناخ 11. في الوقت نفسه، هناك 12 شهرًا في السنة. لذلك، فإن متغيرات المدخلات هي 12. تُستخدم النماذج لمحاكاة وتوقع التغيرات المناخية لخطوة زمنية واحدة للأمام على مقياس شهري. تُستخدم البيانات من الأشهر الـ 12 الماضية كمدخلات للنماذج الخمسة، وتُستخدم بيانات الشهر التالي كخرج للنماذج الخمسة.
تظهر نتائج المحاكاة للخوارزميات المختلفة في الشبكة العصبية الاصطناعية في الجدول 1. من خلال مقارنة النتائج، يمكن ملاحظة أن أداء التدريب لديهم يختلف بشكل كبير. يتمتع Trainbr بأعلى أدنى RMSE (1.8199) وأدنى MAE (1.4787). كما أن خوارزمية trainbr تؤدي بشكل جيد في مرحلة التحقق، مع R (0.9870) و RMSE (1.9923) و MAE (1.6352) على التوالي. في مرحلة التنبؤ، تكون R و RMSE و MAE لـ trainbr على التوالي 1.8042، مما يدل على قدرته الجيدة على التعميم.
تظهر نتائج المحاكاة لمجموعات مختلفة من دوال التدريب (tansig (T)، purelin (PU)، logsig (L)، poslin (PO)) في الجدول 2. تمتلك مجموعة (logsig-purelin) أدنى قيم RMSE وMAE، وأعلى قيمة R، مما يدل على نجاح هذه المجموعة. بالإضافة إلى ذلك، فإن هذه المجموعة تؤدي أيضًا بشكل جيد في مرحلة التحقق المتقاطع ولديها قدرة جيدة على التعميم في مرحلة التنبؤ.
توضح الجدول 3 النتائج الإحصائية التي تم تحقيقها باستخدام نماذج الذكاء الاصطناعي المختلفة (ANN، RNN، LSTM، CNN) ونموذج CNN-LSTM المقترح من حيث مؤشرات التقييم المختلفة وهي R، RMSE، وMAE في مرحلة التدريب، ومرحلة التحقق، ومرحلة التنبؤ. يحقق نهج CNN-LSTM المقترح دقة توقع متوسط درجة حرارة الغلاف الجوي الشهرية مع وأقل خطأ في RMSE (0.6292) و MAE (0.5048). وهذا يشير إلى أن نموذج CNN-LSTM أكثر فعالية من غيره في توقع متوسط درجة حرارة الغلاف الجوي الشهري. تم تحقيق الحد الأدنى من خطأ التنبؤ بواسطة نموذج CNN-LSTM مقارنةً بالنماذج الأخرى للذكاء الاصطناعي. كلما كان خطأ التنبؤ أقل، كانت دقة الأداء والتنبؤ أكبر. لقد أدت نموذج CNN-LSTM الهجين أداءً أفضل من النماذج الأربعة في محاكاة متوسط درجة حرارة الغلاف الجوي لشهر واحد قادم.
تمثل الأشكال 6 متوسط درجة الحرارة الجوية الشهري المتوقع بالنسبة لنماذج مختلفة. القيمة المتوقعة لنموذج الهجين CNN-LSTM قريبة جداً من القيمة الفعلية. يمكن للنماذج الخمسة التقاط اتجاهات متوسط درجة الحرارة الجوية الشهري وكذلك القمم بكفاءة. ومع ذلك، فإن أداء نموذج CNN-LSTM في محاكاة متوسط درجة الحرارة الجوية الشهري هو الأمثل.

مقارنة بين درجات الحرارة الجوية القصوى الدنيا الشهرية الملاحظة والمحاكاة

الجدول 4 يقارن بين درجات الحرارة الجوية القصوى الدنيا الشهرية الملحوظة والمحاكاة باستخدام أفضل نماذج الشبكات العصبية الاصطناعية (ANN) والشبكات العصبية المتكررة (RNN) والشبكات العصبية طويلة الأمد (LSTM) والشبكات العصبية التلافيفية (CNN) ونموذج CNN-LSTM لشهر واحد قادم تم محاكاته خلال الفترات الثلاث. من الجدير بالذكر أن النماذج الخمسة أظهرت أداءً أفضل في فترة المعايرة (التدريب) وفترة التحقق وفترة التنبؤ وفقًا لقيم R و RMSE و MAE. نموذج CNN-LSTM هو الأكثر دقة في توقع درجات الحرارة الجوية القصوى الدنيا الشهرية التي تقدم خطوة واحدة للأمام بناءً على معايير أداء R و RMSE و MAE. قيم R و RMSE و MAE هي على التوالي و
وظائف التدريب ر جذر متوسط مربع الخطأ (RMSE) ) ماي )
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
ترينبر 0.9894 0.9870 0.9907 1.8199 1.9923 2.0669 1.4787 1.6352 1.8042
تدريب 0.9891 0.9865 0.9903 1.8280 1.9947 ٢.٢٠٥٥ 1.5286 1.6417 1.8223
تراينغديكس 0.9848 0.9831 0.9865 ٢.٥٨٦٥ ٢.٦٠٣٢ ٢.٦٢٣٢ 2.0750 2.1694 ٢.٢٨٨٤
تدريب 0.9843 0.9829 0.9863 3.3718 3.3298 3.2961 2.7721 ٢.٨٣٣٢ 2.8319
ترينغدم 0.9869 0.9845 0.9875 ٢.٥٣٣٥ ٢.٥٧٠١ ٢.٥٣٩٥ ٢.٠٥٠٩ ٢.١٤٥٤ 2.1707
ترينغدا 0.9857 0.9839 0.9867 ٢.٢٢٧٠ 2.3107 ٢.٤٩١٢ 1.8536 1.9816 2.1897
تدريب 0.9871 0.9856 0.9890 1.8872 1.9955 ٢.٤٠٧١ 1.6493 1.6761 1.8887
ترين سي جي بي 0.9888 0.9853 0.9804 1.8347 1.9958 ٢.٥٢٥٥ 1.6806 1.6718 1.8886
تدريب 0.9887 0.9857 0.9802 1.8494 1.9955 ٢.٤١٦٦ 1.6243 1.6572 1.8801
ترين سي جي بي 0.9797 0.9777 0.9808 2.1680 ٢.١٥٧٧ 2.9158 1.7103 1.7804 1.8576
تدريب 0.9876 0.9852 0.9802 1.8518 1.9958 2.4130 1.6286 1.6853 1.8755
تدريب بي إف جي 0.9878 0.9853 0.9880 1.8462 1.9946 ٢.٤٠٨٦ 1.6244 1.6922 1.8613
ترينوس 0.9880 0.9854 0.9889 1.8350 1.9957 ٢.٥٣٦٦ 1.6653 1.6671 1.8932
الجدول 1. مقارنة بين خوارزميات التدريب المختلفة في نموذج الشبكة العصبية الاصطناعية.
دوال النقل ر جذر متوسط مربع الخطأ (RMSE) ) ماي )
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
تي-بيو 0.9889 0.9859 0.9904 1.8382 1.9949 ٢.١٣٧٣ 1.5046 1.6413 1.8125
تي-أل 0.9879 0.9848 0.9902 1.8355 1.9950 ٢.٢٩١٠ 1.5057 1.6517 1.8210
تي-تي 0.9869 0.9839 0.9901 1.8351 1.9959 ٢.٢٨٧٣ 1.5060 1.6516 1.8193
L-PU 0.9894 0.9870 0.9907 1.8199 1.9923 2.0669 1.4787 1.6352 1.8042
ل-ت 0.9859 0.9829 0.9898 1.8353 1.9949 ٢.٢٨٧٣ 1.5056 1.6416 1.8142
ل-ل 0.9849 0.9818 0.9903 1.8354 1.9950 2.2829 1.5056 1.6621 1.8309
بي يو – تي 0.9878 0.9827 0.9883 1.8575 1.9962 ٢.٥٧٧١ 1.5228 1.6723 1.8228
PU-L 0.9877 0.9855 0.9873 1.8780 1.9986 ٢.٨٣٣٩ 1.5411 1.6646 1.8557
بيو-بيو 0.9886 0.9856 0.9886 1.8524 1.9968 ٢.٥٠٢٨ 1.5191 1.6829 1.8258
تي-بو 0.9839 0.9828 0.9902 1.8373 1.9951 ٢.٢٩٣٤ 1.5070 1.6916 1.8309
ال-بو 0.9829 0.9882 0.9898 1.8356 1.9952 2.3004 1.5063 1.6519 1.8211
بو-بو 0.9819 0.9818 0.9892 1.8440 1.9954 ٢.٤٥٨٤ 1.5120 1.6514 1.8281
PU-PO 0.9886 0.9856 0.9886 1.8690 1.9985 2.8205 1.5344 1.6648 1.8544
PO-L 0.9885 0.9857 0.9868 1.8527 1.9959 2.6051 1.5186 1.6721 1.8304
بو-بو 0.9850 0.9848 0.9892 1.8439 1.9953 ٢.٤٥٩٣ 1.5120 1.6814 1.8209
بو-تي 0.9879 0.9827 0.9900 1.8396 1.9957 ٢.٤٢٤٩ 1.5081 1.6519 1.8218
الجدول 2. مقارنة بين دوال النقل المختلفة في نموذج الشبكة العصبية.
نماذج ر جذر متوسط مربع الخطأ (RMSE) ) ماي )
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
إيه إن إن 0.9894 0.9870 0.9907 1.8199 1.9923 2.0669 1.4787 1.6352 1.8042
شبكة عصبية متكررة 0.9905 0.9881 0.9895 1.3891 1.5245 1.4416 1.0836 1.1594 1.1917
LSTM 0.9906 0.9870 0.9914 1.3819 1.5965 1.3482 1.0710 1.2278 1.1485
سي إن إن 0.9968 0.9965 0.9969 0.8148 0.8249 0.8015 0.6387 0.6290 0.6680
سي إن إن – إل إس تي إم 0.9982 0.9982 0.9981 0.6422 0.6270 0.6292 0.5043 0.4726 0.5048
الجدول 3. تحليل المقارنة بين النماذج المختلفة لدرجة الحرارة الجوية الشهرية المتوسطة المحاكاة.
الشكل 6. مقارنة بين القيم المرصودة والقيم المتوقعة لدرجة الحرارة الجوية الشهرية المتوسطة في جينان من 2015 إلى 2022. (أ) رسم نتائج التنبؤ، (ب) رسم بياني متفرق لنتائج التنبؤ.
أثناء تدريب نموذج CNN-LSTM مع البيانات الأساسية. لقد توقعت شبكة CNN-LSTM بشكل جيد الحد الأدنى الشهري لدرجة حرارة الغلاف الجوي مع معامل الارتباط R بقيمة 0.9970، وRMSE قدره MAE من على التوالي.
تمثل الشكل 7 النتائج المحاكاة للنماذج الخمسة للذكاء الاصطناعي لتوقع درجة الحرارة الجوية القصوى الدنيا لمرة واحدة في الخطوة الزمنية القادمة خلال فترة التنبؤ. تلتقط النماذج الخمسة التغيرات الزمنية والقمم لدرجة الحرارة الجوية القصوى الدنيا الشهرية. ومع ذلك، فإن أداء نموذج CNN-LSTM في محاكاة درجة الحرارة الجوية القصوى الدنيا الشهرية هو الأمثل.
نماذج ر جذر متوسط مربع الخطأ (RMSE) ) ماي )
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
إعلان 0.9790 0.9741 0.9696 ٢.١٨٧٤ 2.3985 ٢.٦٢٣٨ 1.7348 1.8691 1.9254
شبكة عصبية متكررة 0.9782 0.9733 0.9709 2.3703 ٢.٥٩٥١ 2.8135 1.9171 ٢.٠٦٥١ ٢.٢٣٧٢
LSTM 0.9806 0.9769 0.9719 2.1011 ٢.٢٥٨٧ ٢.٥٣٢٠ 1.6674 1.6604 1.9572
سي إن إن 0.9942 0.9936 0.9942 1.1576 1.1977 1.1528 0.9102 0.9197 0.8200
سي إن إن – إل إس تي إم 0.9971 0.9973 0.9970 0.8350 0.7785 0.8287 0.6583 0.5809 0.5979
الجدول 4. تحليل المقارنة بين النماذج المختلفة لدرجات الحرارة الجوية القصوى الدنيا الشهرية المحاكاة.
الشكل 7. مقارنة بين القيم المرصودة والقيم المتوقعة لدرجة الحرارة الجوية القصوى الدنيا الشهرية في جينان من 2015 إلى 2022. (أ) رسم نتائج التنبؤ، (ب) رسم بياني متفرق لنتائج التنبؤ.

مقارنة بين درجات الحرارة القصوى الشهرية الملاحظة والمحاكاة

يوضح الجدول 5 قيمة R وMSE وRMSE للنماذج الخمسة لتوقع خطوة زمنية واحدة في فترات التدريب والتحقق والاختبار. يتمتع نموذج CNN-LSTM بأقل خطأ وأعلى ارتباط في محاكاة أقصى درجة حرارة جوية شهرية في فترات المعايرة والتحقق والتنبؤ. النتائج المحاكاة في مرحلة التنبؤ لقيم معايير R وRMSE وMAE لنموذج CNN-LSTM في خطوة واحدة للأمام هي و على التوالي. ومع ذلك، فإن نتائج التنبؤ لشهر واحد مقدماً لنماذج ANN وRNN وLSTM وCNN مقبولة. نموذج CNN-LSTM يتفوق على نماذج ANN وRNN وLSTM وCNN. على سبيل المثال، فإن قيم RMSE في فترة التنبؤ لأفضل نماذج ANN وRNN وLSTM وCNN، للتنبؤ بأقصى درجة حرارة جوية شهرية في خطوة زمنية واحدة مقدماً. ، و على التوالي، يتم الحصول عليها.
الشكل 8 يقارن بين درجات الحرارة القصوى الجوية الملاحظة والمتوقعة باستخدام نماذج ANN وRNN وLSTM وCNN وCNN-LSTM للتنبؤ بخطوة زمنية واحدة في مرحلة التنبؤ على المقياس الزمني الشهري. تشير النتائج إلى أن نموذج CNN-LSTM قد توقع بدقة جيدة ذروات درجات الحرارة القصوى الجوية. بشكل عام، فإن توقعات نموذج CNN-LSTM في خطوة زمنية واحدة أفضل من نماذج ANN وRNN وLSTM وCNN.
نماذج ر جذر متوسط مربع الخطأ (RMSE) ) ماي )
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
إيه إن إن 0.9647 0.9621 0.9689 ٢.٤٢٦٩ ٢.٥١٣٢ ٢.٢٣٤٥ 1.8372 1.9768 1.6627
شبكة عصبية متكررة 0.9643 0.9611 0.9666 ٢.٤٨٠٦ ٢.٥٧٦٢ 2.2979 1.9156 ٢.٠٤٨١ 1.6812
LSTM 0.9668 0.9591 0.9709 ٢.٣٤٥٢ 2.6012 ٢.١٦٦٦ 1.8163 2.0398 1.6583
سي إن إن 0.9948 0.9950 0.9962 0.9446 0.9604 0.8212 0.7346 0.7354 0.6202
سي إن إن – إل إس تي إم 0.9987 0.9982 0.9987 0.5339 0.6213 0.4932 0.4216 0.4848 0.3931
الجدول 5. تحليل المقارنة بين النماذج المختلفة لدرجة الحرارة القصوى الجوية الشهرية المحاكاة.
الشكل 8. مقارنة بين القيم المرصودة والقيم المتوقعة لدرجة الحرارة القصوى الشهرية في جينان من 2015 إلى 2022. (أ) رسم نتائج التنبؤ، (ب) رسم بياني متفرق لنتائج التنبؤ.

مقارنة بين هطول الأمطار الشهري المرصود والمحاكى

تمثل الجدول 6 تحليل R، وتحليل MAE و RMSE على التوالي بالنسبة للنماذج الخمسة. قيم الخطأ (MAE و RMSE) التي حققها نموذج CNN-LSTM أقل مقارنة بالنماذج الأربعة الأخرى مثل ANN و RNN و LSTM و CNN. قيم MAE و RMSE التي حققها نموذج CNN-LSTM في فترة التنبؤ هي 8.1762 مم و 6.7051 مم على التوالي. قيمة R للنموذج المقترح CNN-LSTM هي 0.9962، وهي أكبر مقارنة بالنماذج الحالية الأخرى. من نموذج ANN إلى نموذج CNN-LSTM، تنخفض قيم RMSE و MAE، بينما تزيد قيمة R.
تظهر الشكل 9 النتائج المتوقعة لخمس نماذج وهطول الأمطار الفعلي. يوضح الشكل بوضوح أن الأداء العام لنموذج CNN-LSTM يتفوق على نماذج ANN و RNN و LSTM و CNN. تتوافق الاتجاهات في CNN و CNN-LSTM بشكل أفضل مع الملاحظات مقارنة بنماذج ANN و RNN و LSTM. علاوة على ذلك، تشير الشكل 4 إلى أن نموذج ANN يؤدي بشكل أقل من نماذج RNN و LSTM. لا يمكن لنموذج ANN التقاط اتجاهات هطول الأمطار الشهرية بكفاءة وكذلك القمم، ولديه ارتباط ضعيف مع
نماذج ر جذر متوسط مربع الخطأ (مم) MAE (مم)
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
إيه إن إن 0.6853 0.6823 0.7092 ٥٨٫٧٧٣٦ ٥٦.٣٧٦٧ 67.4976 ٣٩.٨٨٩١ ٣٤.٤٨٠١ 42.5787
شبكة عصبية متكررة 0.7412 0.7452 0.7590 53.0472 50.2847 62.1261 ٣٣.١٣٥٥ ٢٩.٣٨٨٣ ٣٧.٧٥٦٥
LSTM 0.7685 0.7246 0.7672 50.6978 52.4807 60.5523 ٣٢.٥٠٧٩ 31.4153 ٣٦.٠٧٤٨
سي إن إن 0.9691 0.9629 0.9857 ٢٠٫٢٤٣٢ ٢٢.٥٧٧٧ 16.8436 13.8417 13.8229 11.8683
سي إن إن – إل إس تي إم 0.9952 0.9930 0.9962 7.8252 8.8947 8.1762 6.0644 6.7083 6.7051
الجدول 6. تحليل المقارنة بين النماذج المختلفة لهطول الأمطار الشهري المحاكى.
الشكل 9. مقارنة بين القيم المرصودة والقيم المتوقعة لهطول الأمطار الشهري في جينان من 2015 إلى 2022. (أ) رسم نتائج التوقعات، (ب) رسم بياني متفرق لنتائج التوقعات.
تمت ملاحظة هطول الأمطار. لا يمكن لمحاكاة الشبكة العصبية الاصطناعية تحقيق هدف محاكاة المناخ، بينما يمكن لنتائج المحاكاة باستخدام الشبكة العصبية التلافيفية والشبكة العصبية التلافيفية مع الذاكرة طويلة الأمد تحقيق ذلك.

مقارنة بين الرطوبة النسبية الشهرية المتوسطة المرصودة والمحاكاة

تمثل الجدول 7 قيم R و RMSE و MAE للنماذج الخمسة. تم اختيار أفضل نموذج CNN-LSTM بأقل قيمة لـ RMSE و MAE وأعلى قيمة لـ R في كل من مراحل التحقق والتنبؤ. في الجدول 5، قيم معايير RMSE و MAE و R لنموذج CNN-LSTM في مراحل التنبؤ. هم و0.9984، على التوالي.
تظهر الشكل 10 الأداء المتفوق لنموذج CNN-LSTM مقارنة بنماذج ANN وRNN وLSTM وCNN في توقع متوسط الرطوبة النسبية الشهرية. لقد تمكن نموذج CNN-LSTM الهجين من محاكاة وتوقع ذروات الرطوبة النسبية بشكل جيد.

مقارنة بين ساعات ضوء الشمس الشهرية المرصودة والمحاكاة

يوضح الجدول 8 قيم R و RMSE و MAE لنماذج ANN و RNN و LSTM و CNN و CNN-LSTM في مراحل التدريب والتحقق والتنبؤ. يتمتع نموذج CNN-LSTM المحسن في مرحلة التنبؤ بمعايير تقييم أفضل، مع ، على التوالي.
تظهر الشكل 11 النتائج التي تقارن بين ساعات ضوء الشمس (ساعات الشمس) الملاحظة والمتوقعة شهريًا باستخدام نماذج الشبكة العصبية الاصطناعية (ANN) والشبكة العصبية التكرارية (RNN) وLSTM وCNN وCNN-LSTM للتنبؤ بشهر واحد قادم خلال فترة التنبؤ. أيضًا، فإن القيم المتوقعة لنموذج CNN-LSTM أكثر تماسكًا بالقرب من القيم الملاحظة، مقارنة بنماذج ANN وRNN وLSTM وCNN. هذا يعني أداءً أفضل لنموذج CNN-LSTM.
نماذج ر جذر متوسط مربع الخطأ (%) MAE (%)
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
إيه إن إن 0.7444 0.7452 0.7672 7.9631 8.6807 7.4171 6.3622 6.9138 5.9593
شبكة عصبية متكررة 0.7693 0.7549 0.7874 7.6236 8.3876 7.0419 6.0314 6.5664 5.6321
LSTM 0.7779 0.7862 0.7934 7.4957 7.8915 6.9580 6.0077 6.0309 5.4739
سي إن إن 0.9935 0.9943 0.9919 1.4208 1.4384 1.4513 1.0988 1.0889 1.1419
سي إن إن – إل إس تي إم 0.9988 0.9987 0.9984 0.6222 0.7171 0.6615 0.4991 0.5546 0.5093
الجدول 7. تحليل المقارنة بين النماذج المختلفة لقياس متوسط الرطوبة النسبية الشهرية المحاكية.
الشكل 10. مقارنة بين القيم المرصودة والقيم المتوقعة للرطوبة النسبية الشهرية المتوسطة في جينان من 2015 إلى 2022. (أ) رسم نتائج التنبؤ، (ب) رسم بياني متفرق لنتائج التنبؤ.
نماذج ر RMSE (ساعة) MAE (ساعة)
تدريب التحقق التنبؤ تدريب التحقق التنبؤ تدريب التحقق التنبؤ
إيه إن إن 0.7095 0.5295 0.6413 ٣٤.٩٤٣٦ 41.8596 37.4016 ٢٧.٩٥٧٠ 32.7740 ٢٩.٧٧٧٨
شبكة عصبية متكررة 0.7468 0.6156 0.6752 ٣٢.٩٧٠٤ ٣٨.٧٣١٤ ٣٦.١٨٩٦ ٢٦.٧٠٩٧ 30.6143 ٢٨.٦٥١٩
LSTM 0.7515 0.5801 0.7192 ٣٢.٦٥٥٠ ٣٩.٩٨٨٥ 33.9022 ٢٦.٣٩٩٦ 30.9942 ٢٧.٠٢٦٩
سي إن إن 0.9903 0.9940 0.9939 7.0557 ٥.٧٥٢٠ 5.6467 5.5325 ٤.٥٩٣٧ ٤.٣٧٤٢
سي إن إن – إل إس تي إم 0.9984 0.9988 0.9984 2.9650 ٢.٥٨٢٤ 2.9058 ٢.٣٤٩١ 2.0115 2.3794
الجدول 8. تحليل المقارنة بين النماذج المختلفة لساعات ضوء الشمس الشهرية المحاكاة.
الشكل 11. مقارنة بين القيم المرصودة والقيم المتوقعة لساعات ضوء الشمس الشهرية في جينان من 2015 إلى 2022. (أ) رسم نتائج التوقعات، (ب) رسم بياني متفرق لنتائج التوقعات.

مقارنة مع أدبيات أخرى

يمكن استنتاج ذلك من الجداول و 6 أن نموذج CNN-LSTM يحسن من نماذج CNN و LSTM، حيث أن RMSE و MAE له أصغر و R أكبر من نماذج CNN و LSTM في مراحل التدريب والتحقق والاختبار. لذلك، يمكن تصنيف أداء النماذج من الأعلى إلى الأدنى كالتالي: CNNLSTM > CNN > LSTM > RNN > ANN. قدرة التعميم للنماذج الخمسة تتماشى مع ترتيب أدائها في التوافق. يوفر نموذج CNN-LSTM ضمانًا قويًا للمرونة في التقاط الميزات الموروثة لبيانات المناخ.
بالإضافة إلى مقاييس الخطأ البديهية الموضحة أعلاه، قمنا أيضًا بحساب متوسط وقت التشغيل من خلال تسجيل 100 تشغيل عشوائي لكل نموذج، وتم تسجيل نتائج التشغيل في الجدول 9. من بين جميع النماذج، يعتبر CNN-LSTM هو النموذج الأكثر تكلفة من الناحية الحسابية، بينما يعتبر ANN هو الأقل تكلفة من الناحية الحسابية. ومع ذلك، فإن CNN-LSTM يزيد في دقة التنبؤ.
تم تطبيق نماذج مختلفة من الذكاء الاصطناعي على توقعات المناخ في مناطق مختلفة. الجذر التربيعي لمتوسط مربع الخطأ و تم حساب قيم نموذج الشبكة العصبية التقدمية (FNN) لتوقع الحد الأدنى الشهري لدرجة حرارة الغلاف الجوي (Tmin) في تركيا بحوالي و0.98 لعملية الاختبار، على التوالي. الـ تم حساب قيمة نموذج FNN لتوقع الحد الأقصى الشهري لدرجة حرارة الهواء (Tmax) كـ 0.9928، في حين تم الحصول على قيمة RMSE كـ إن شبكة FNN أكثر نجاحًا من شبكة Elman العصبية (ENN) في نمذجة Tmin وTmax ومتوسط درجة حرارة الهواء الشهري (T). تم تقديم خوارزمية شبكة عصبية انحدارية نهارية للتنبؤ بدرجة حرارة الهواء في المدن في الولايات المتحدة. تولد الإحصائيات انحيازًا قدره 0.8 كلفن، وخطأ جذر متوسط المربعات قدره 2.6 كلفن، و من نموذج توقع درجة حرارة الغلاف الجوي GATG يدمج وحدة شبكة الانتباه البيانية (GAT) وخلايا الوحدة المتكررة المغلقة (GRU). عندما تكون مدة التنبؤ 96 ساعة في الصين، فإن نتائج RMSE و MAE ومعامل الارتباط (CORR) لنموذج GATG تبلغ حوالي 3.161 و 2.849 و 0.831، على التوالي. تم بناء CEEMD-BiLSTM باستخدام CEEMD (تحليل النمط التجميعي التكاملي) وBiLSTM (LSTM الاتجاهي)، ويستخدم للتنبؤ بدرجات الحرارة الشهرية في مدينة تشنغتشو. متوسط الخطأ النسبي لـ CEEMD-BiLSTM حوالي تشير الأداء إلى أن النموذج لديه جودة توقع جيدة. نموذج CEEMDAN-BO-BiLSTM لديه متوسط الخطأ المطلق (MAE) قدره 1.17، وجذر متوسط مربع الخطأ (RMSE) قدره 1.43 لدرجة حرارة الهواء الشهرية في مدينة جينان. دقة توقعات نموذجنا مشابهة لتلك النماذج.
تتميز سلسلة هطول الأمطار (P) بالعشوائية غير القابلة للتنبؤ وغير الخطية. وبالتالي، فإن التنبؤ الدقيق بـ P يعد عملاً شاقًا للغاية. لتحسين دقة توقعات سلسلة P، يتم تحليل بيانات P إلى بعض المكونات الفرعية من خلال طرق تحليل مختلفة (تحويل الموجات (WT)، التصفية المتغيرة زمنياً (TVF-EMD)، وCEEMD). ثم يتم استخدام الشبكة العصبية المتقدمة (ENN) لبناء نماذج WT-ENN وTVF-EMD-ENN وCEEMD-ENN لتوقع المكونات الفرعية لـ P. أخيرًا، يتم تطبيق النماذج على سلسلة P في اثني عشر منطقة مختلفة في الصين. التنبؤات التي قدمها نموذج TVF-EMD-ENN أفضل من تلك التي قدمها نموذج WT-ENN وCEEMD-ENN. تم بناء نموذج توقع شهري هجين (ABR-LSO) من خلال دمج مُنظم AdaBoost (ABR) مع خوارزمية تحسين سرب الأسود (LSO). قيم RMSE و MAE لـ ABR-LSO هي 52.39 و 39.89 في إيدوكي، الهند. تم استخدام نموذج LSTM متعدد المقاييس مع آلية الانتباه (MLSTM-AM) لتحسين دقة توقعات هطول الأمطار الشهرية. متوسط كفاءة ناش-سوتكليف (NSE) والخطأ المطلق النسبي (RAE) في حوض نهر يانغتسي (YRB) للنموذج هو 0.66 و 0.35. أداء MLSTM-AM أفضل من LSTM و MLSTM والانحدار الخطي المتعدد (MLR). نموذجنا لديه دقة توقع أعلى من هذه النماذج.
تم استخدام نموذجين من الشبكات العصبية الاصطناعية، وهما دالة القاعدة الشعاعية (RBF) والطبقة المتعددة من البيرسيترون (MLP)، لتوقع المتغيرات الجوية الساعية والشهرية في أونجول وحيدر أباد، الهند. الـ RBF و
نماذج إيه إن إن شبكة عصبية متكررة LSTM سي إن إن سي إن إن – إل إس تي إم
متوسط الوقت المنقضي 17 ١٨ 19 40 89
الجدول 9. متوسط الوقت لكل نموذج.
قدمت MLP حوالي دقة التوقعات لدرجة حرارة الهواء (AT) ودرجة حرارة التربة (ST) والرطوبة النسبية (RH). بالإضافة إلى ذلك، أظهرت التوقعات ارتباطًا قويًا مع البيانات المسجلة بين حوالي 0.61 و .
تُستخدم خوارزميات التعلم الآلي المختلفة للتنبؤ بدرجة الحرارة (AT) والرطوبة النسبية (RH) في ولاية ترينجانو في ماليزيا. يُظهر الشبكة العصبية متعددة الطبقات (MLP-NN) أداءً جيدًا في توقع الرطوبة النسبية اليومية ودرجة الحرارة مع معامل ارتباط (R) يبلغ حوالي 0.633 و0.713 على التوالي. ومع ذلك، في توقع درجة الحرارة الشهرية، يمكن استخدام MLP-NN للتنبؤ بدرجة الحرارة الشهرية مع معامل ارتباط (R) يبلغ حوالي 0.846. بينما في توقع الرطوبة النسبية الشهرية، فإن كفاءة دالة الأساس الشعاعي (RBF-NN) أعلى من النماذج الأخرى مع معامل ارتباط (R) يبلغ حوالي 0.711. تشير النتائج إلى أن هناك إمكانيات كبيرة للتنبؤ بقيم درجة الحرارة والرطوبة النسبية بدقة مقبولة على أي من هياكل الشبكة العصبية الاصطناعية. تُستخدم الشبكات العصبية الاصطناعية للتنبؤ بالرطوبة النسبية الشهرية (RH) في محافظة سيفاس، تركيا. تراوحت قيم R و MAE و RMSE بين حوالي ، و ، على التوالي. تظهر النتائج أن الشبكة العصبية الاصطناعية تقدم توقعات مرضية للشهرية تم استخدام نماذج المتوسط المتحرك الذاتي الموسمي (SARIMA) والشبكات العصبية الاصطناعية (ANN) للتنبؤ بالرطوبة النسبية الشهرية في دلهي، الهند. يوفر نموذج SARIMA الرطوبة النسبية المتوقعة مع جذر متوسط مربع الخطأ (RMSE) يبلغ حوالي 6.0 ومتوسط الخطأ المطلق (MAE) يبلغ حوالي 4.6. ومع ذلك، أفاد نموذج ANN بالرطوبة النسبية المتوقعة مع RMSE يبلغ حوالي 4.7 وMAE يبلغ حوالي 3.4. تعتبر ANN أكثر موثوقية في التنبؤ بالرطوبة النسبية مقارنةً بـ SARIMA. تم استخدام LSTM ونظام الاستدلال العصبي الضبابي التكيفي (ANFIS) للتنبؤ برطوبة الهواء ليوم واحد في تركيا. خلال فترة الاختبار، كانت قيم MAE وR وRMSE لـ LSTM هي و على التوالي، في محافظة أرضروم. علاوة على ذلك، فإن قيمهم هي و على التوالي، في محافظة أرضروم باستخدام ANFIS. تشير النتائج إلى أن ANFIS و LSTM يحققان أداءً مرضيًا في توقع الرطوبة النسبية. نموذجنا لديه أخطاء توقع أقل من هذه النماذج.
تُستخدم الشبكات العصبية الاصطناعية لتقدير مدة سطوع الشمس (SD) في إيران. متوسط معامل التحديد ( تم حساب خطأ التحيز المتوسط (MBE) وRMSE للمقارنة بين SD المقاسة والمقدرة مما أسفر عن و على التوالي تم استخدام ثلاثة نماذج مختلفة من الشبكات العصبية الاصطناعية، وهي الشبكة العصبية العامة للتراجع (GRNN)، والشبكة العصبية متعددة الطبقات (MLP)، والشبكة العصبية الشعاعية (RBF)، في تقدير مدة سطوع الشمس (SD) في تركيا. متوسط مدة سطوع الشمس المقدرة هو حوالي 6.795 ساعة، 6.772 ساعة، و0.672 ساعة بواسطة MLP وGRNN وRBF مع خطأ التحيز المتوسط (MBE). و -0.054 ساعة، متوسط الخطأ المطلق النسبي (MAPE) و جذر متوسط مربع الخطأ ، و 1.128 ، نسبة الجذر المتوسط التربيعي للخطأ (%RMSE) و وتم العثور على R و 0.890 على التوالي. تشير المؤشرات الإحصائية إلى أن نماذج MLP و GRNN تحقق نتائج أفضل من RBF نموذجنا لديه دقة توقع أعلى من هذه النماذج.
في هذه المقالة، نقترح طريقة أكثر فعالية للتنبؤ بالمناخ الشهري لمدينة جينان. تعتمد الطريقة المقترحة على دمج نماذج CNN و LSTM. من أجل تقييم فعالية نموذج CNN-LSTM التنبؤية بشكل أكبر، تتم مقارنة نتائج التنبؤ لنموذج CNN-LSTM مع النماذج الثلاثة الأخرى (ANN و RNN و LSTM و CNN). باختصار، في مقارنة الأداء بين النماذج الخمسة، يمكن ملاحظة أن CNN-LSTM يمكنه التعامل بشكل أفضل مع إشارات المناخ غير الخطية وغير الثابتة. بالنسبة لمعالجة السلاسل الزمنية المناخية، فإن LSTM مناسب لتوقع بيانات المناخ غير الخطية، ويمكنه تحسين دقة التنبؤ لـ CNN بشكل أكبر. بالإضافة إلى ذلك، يمكن لنموذج LSTM التقاط سلسلة من المعلومات المناخية قبل وبعد، مما يسهل التنبؤ بسلاسل المناخ غير السلسة وغير الخطية. بالنظر إلى مزايا هذين النموذجين، فإن نموذج CNN-LSTM المبني قابل للتطبيق لتوقع تسلسلات المناخ غير الخطية مع أداء تنبؤي أفضل ودقة أعلى. وبالتالي، يعمل CNN-LSTM بشكل أفضل في توقع المناخ، مما يشير إلى أن CNN-LSTM فعال وقابل للتطبيق في توقع بيانات المناخ غير الثابتة. عند اقتراح واختبار وتقييم هذه الطريقة الجديدة، نعتزم تقديم دعم القرار للتخطيط العقلاني المستقبلي، خاصة في مجال السيطرة على الفيضانات وتقليل الكوارث.

الخاتمة

(1) تم التحقيق في إمكانيات نماذج الذكاء الاصطناعي لتوقع عوامل المناخ الشهري خلال الفترة من 1951 إلى 2022 في مدينة جينان في هذه الدراسة. تم تقديم نموذج التنبؤ بالمناخ الجديد “CNN-LSTM” للتنبؤ بدقة بالعناصر المناخية استنادًا إلى البيانات التاريخية. تم التحقق من فعالية CNN-LSTM من خلال بيانات المناخ في مدينة جينان. تم التحقيق في أداء CNN-LSTM باستخدام ثلاثة مؤشرات تقييم وهي MAE و R و RMSE.
(2) تم مقارنة CNN-LSTM مع ANN و RNN و LSTM و CNN باستخدام نفس بيانات المناخ الشهرية. تم اشتقاق أوقات تأخر المتغيرات المدخلة من دورة بيانات المناخ الشهرية. الأداء الذي حققه نموذج CNN-LSTM أكبر من النماذج الأخرى المقارنة من الذكاء الاصطناعي (ANN و RNN و LSTM و CNN). نتائج التنبؤ لنموذج CNN-LSTM متفوقة على النماذج الأخرى من حيث القدرة على التعميم والدقة. وهذا يدل على فعالية نموذج CNN-LSTM المقترح مقارنة بالنماذج الأخرى الموجودة. وهذا يعني أنه مقارنة بالنماذج الأخرى، فإن CNN-LSTM لديه أدنى قيم RMSE و MAE وأعلى قيمة R.
(3) في مراقبة تغير المناخ، المناخ المتطرف له أهمية استثنائية، ونموذج CNN-LSTM لديه أيضًا كفاءة أعلى من النماذج الأربعة الأخرى في توقع المناخ المتطرف. تظهر الاستطلاعات أن درجة الحرارة الجوية المتطرفة المتوقعة أكثر دقة من هطول الأمطار المتوقع. نموذج CNN قريب من نموذج CNN-LSTM في بعض المعاملات الفردية ولكن الأخطاء تظهر أن CNN-LSTM لديه أداء أكثر استقرارًا. يمكن لـ CNN-LSTM التنبؤ بشكل معقول بحجم وتغيرات المناخ الشهرية، والتقاط قمم بيانات المناخ، وتلبية معايير تقييم أداء النموذج. يعد CNN-LSTM نهجًا واعدًا لمحاكاة المناخ.

القيود والاقتراحات

(1) القيم المناخية الشهرية المحاكية لنموذج CNN-LSTM الهجين مشابهة بشكل كبير للقيم المناخية المرصودة، ولكن هناك بعض الاختلافات التي تتطلب بيانات مناخية متعددة المقاييس الزمنية أكثر دقة. هذه الدراسة اعتبرت فقط بيانات المناخ التاريخية للشهر كمتغير مدخل للنموذج. لذلك، يتطلب بناء نموذج ساعي بيانات بدقة أعلى. يمكن أن يوفر استخدام بيانات مناخية دقيقة متعددة المقاييس الزمنية تحسينات في التنبؤ بالمناخ.
(2) في المستقبل، ستتم مقارنة دقة التنبؤ لـ CNN-LSTM أيضًا مع النماذج الديناميكية الحالية المعتمدة على الفيزياء. يمكن توسيع النماذج بشكل أكبر من خلال تطبيق تقنيات التحليل (WT و TVF-EMD و CEEMD) و LSTM ثنائي الاتجاه (BiLSTM) والتعلم الانتقالي و GRU ثنائي الاتجاه (BiGRU) وأخذ المكونات المتبقية من بيانات المناخ كمدخلات لتطوير النماذج. سيتم تحسين أداء نمذجة المناخ بشكل أكبر من خلال استكشاف المقاييس الزمنية المتعددة والميزات المكانية وعوامل أخرى مثل الإشعاع الشمسي ودرجة حرارة الدفيئة والتضاريس والنباتات و ظاهرة النينيو والتذبذب الجنوبي، إلخ. يمكن استخدام هذه الاستراتيجية لأي تطبيق تنبؤي لوضع خطط تشغيلية قصيرة ومتوسطة وطويلة الأجل. لذلك، يمكن الاستفادة من قوة النماذج للتنبؤ بعناصر المناخ متعددة المقاييس الزمنية. في محاكاة وتنبؤ المناخات المتطرفة المختلفة، سنقوم بدمج بيانات متعددة مثل الاستشعار عن بعد والملاحظات الأرضية لنمذجة المناخ متعددة المقاييس الزمانية والمكانية. في عملية نمذجة المناخ، سنقوم بدمج الآليات الفيزيائية في نماذج التعلم الآلي لتحسين قابلية التفسير والقدرة على التعميم للنماذج. يوفر ذلك نهجًا تكنولوجيًا جديدًا لدمج النماذج الفيزيائية التقليدية وخوارزميات الذكاء الاصطناعي المتقدمة.

توفر البيانات

البيانات والمواد متاحة من المؤلف المراسل عند الطلب.
تاريخ الاستلام: 27 مايو 2024؛ تاريخ القبول: 29 يوليو 2024
تم النشر عبر الإنترنت: 31 يوليو 2024

References

  1. Guo, Q., He, Z. & Wang, Z. Change in air quality during 2014-2021 in Jinan City in China and its influencing factors. Toxics 11, 210 (2023).
  2. Guo, Q., He, Z. & Wang, Z. Long-term projection of future climate change over the twenty-first century in the Sahara region in Africa under four Shared Socio-Economic Pathways scenarios. Environ. Sci. Pollut. Res. 30, 22319-22329. https://doi.org/10.1007/ s11356-022-23813-z (2023).
  3. Guo, Q. et al. Changes in air quality from the COVID to the post-COVID era in the Beijing-Tianjin-Tangshan region in China. Aerosol Air Qual. Res. 21, 210270. https://doi.org/10.4209/aaqr. 210270 (2021).
  4. Zhao, R. et al. Assessing resilience of sustainability to climate change in China’s cities. Sci. Total Environ. 898, 165568. https://doi. org/10.1016/j.scitotenv.2023.165568 (2023).
  5. Zheng, Y. et al. Assessing the impacts of climate variables on long-term air quality trends in Peninsular Malaysia. Sci. Total Environ. 901, 166430. https://doi.org/10.1016/j.scitotenv.2023.166430 (2023).
  6. Zhou, S., Yu, B. & Zhang, Y. Global concurrent climate extremes exacerbated by anthropogenic climate change. Sci. Adv. 9, eabo1638. https://doi.org/10.1126/sciadv.abo1638 (2023).
  7. Zurek, M., Hebinck, A. & Selomane, O. Climate change and the urgency to transform food systems. Science 376, 1416-1421. https:// doi.org/10.1126/science.abo2364 (2022).
  8. Klisz, M. et al. Local site conditions reduce interspecific differences in climate sensitivity between native and non-native pines. Agricult. For. Meteorol. 341, 109694. https://doi.org/10.1016/j.agrformet. 2023.109694 (2023).
  9. Li, X. et al. Attribution of runoff and hydrological drought changes in an ecologically vulnerable basin in semi-arid regions of China. Hydrol. Process. https://doi.org/10.1002/hyp. 15003 (2023).
  10. Xue, B. et al. Divergent hydrological responses to forest expansion in dry and wet basins of China: Implications for future afforestation planning. Water Resour. Res. 58, e2021WR031856. https://doi.org/10.1029/2021WR031856 (2022).
  11. Guo, Q., He, Z. & Wang, Z. The characteristics of air quality changes in Hohhot City in China and their relationship with meteorological and socio-economic factors. Aerosol Air Qual. Res. 24, 230274. https://doi.org/10.4209/aaqr. 230274 (2024).
  12. Wang, Y., Hu, K., Huang, G. & Tao, W. Asymmetric impacts of El Niño and La Niña on the Pacific-North American teleconnection pattern: The role of subtropical jet stream. Environ. Res. Lett. 16, 114040. https://doi.org/10.1088/1748-9326/ac31ed (2021).
  13. Abbas, G. et al. Modeling the potential impact of climate change on maize-maize cropping system in semi-arid environment and designing of adaptation options. Agricult. For. Meteorol. 341, 109674. https://doi.org/10.1016/j.agrformet.2023.109674 (2023).
  14. Mangani, R., Gunn, K. M. & Creux, N. M. Projecting the effect of climate change on planting date and cultivar choice for South African dryland maize production. Agricult. For. Meteorol. 341, 109695. https://doi.org/10.1016/j.agrformet.2023.109695 (2023).
  15. Liang, R., Sun, Y., Qiu, S., Wang, B. & Xie, Y. Relative effects of climate, stand environment and tree characteristics on annual tree growth in subtropical Cunninghamia lanceolata forests. Agricult. For. Meteorol. 342, 109711. https://doi.org/10.1016/j.agrformet. 2023.109711 (2023).
  16. Kumar, A., Chen, M. & Wang, W. An analysis of prediction skill of monthly mean climate variability. Clim. Dyn. 37, 1119-1131. https://doi.org/10.1007/s00382-010-0901-4 (2011).
  17. Chen, Y. et al. Improving the heavy rainfall forecasting using a weighted deep learning model. Front. Environ. Sci. https://doi.org/ 10.3389/fenvs.2023.1116672 (2023).
  18. Guo, Q., He, Z. & Wang, Z. Predicting of daily PM2.5 concentration employing wavelet artificial neural networks based on meteorological elements in Shanghai, China. Toxics 11, 51 (2023).
  19. He, Z., Guo, Q., Wang, Z. & Li, X. Prediction of monthly PM2.5 concentration in Liaocheng in China employing artificial neural network. Atmosphere 13, 1221 (2022).
  20. Guo, Q. & He, Z. Prediction of the confirmed cases and deaths of global COVID-19 using artificial intelligence. Environ. Sci. Pollut. Res. 28, 11672-11682. https://doi.org/10.1007/s11356-020-11930-6 (2021).
  21. Guo, Q., He, Z. & Wang, Z. Simulating daily PM2.5 concentrations using wavelet analysis and artificial neural network with remote sensing and surface observation data. Chemosphere 340, 139886. https://doi.org/10.1016/j.chemosphere.2023.139886 (2023).
  22. Guo, Q., He, Z. & Wang, Z. Prediction of hourly PM2.5 and PM10 concentrations in Chongqing City in China based on artificial neural network. Aerosol Air Qual. Res. 23, 220448. https://doi.org/10.4209/aaqr. 220448 (2023).
  23. Fang, S. et al. MS-Net: Multi-source spatio-temporal network for traffic flow prediction. IEEE Trans. Intell. Transp. Syst. 23, 7142-7155. https://doi.org/10.1109/TITS.2021.3067024 (2022).
  24. Rajasundrapandiyanleebanon, T., Kumaresan, K., Murugan, S., Subathra, M. S. P. & Sivakumar, M. Solar energy forecasting using machine learning and deep learning techniques. Arch. Comput. Methods Eng. 30, 3059-3079. https://doi.org/10.1007/s11831-023-09893-1 (2023).
  25. Han, Y. et al. Novel economy and carbon emissions prediction model of different countries or regions in the world for energy optimization using improved residual neural network. Sci. Total Environ. 860, 160410. https://doi.org/10.1016/j.scitotenv.2022. 160410 (2023).
  26. Wang, H. et al. Scientific discovery in the age of artificial intelligence. Nature 620, 47-60. https://doi.org/10.1038/s41586-023-06221-2 (2023).
  27. Nathvani, R. et al. Beyond here and now: Evaluating pollution estimation across space and time from street view images with deep learning. Sci. Total Environ. https://doi.org/10.1016/j.scitotenv.2023.166168 (2023).
  28. Faraji, M., Nadi, S., Ghaffarpasand, O., Homayoni, S. & Downey, K. An integrated 3D CNN-GRU deep learning method for shortterm prediction of PM2.5 concentration in urban environment. Sci. Total Environ. 834, 155324. https://doi.org/10.1016/j.scitotenv. 2022.155324 (2022).
  29. Hu, T. et al. Crop yield prediction via explainable AI and interpretable machine learning: Dangers of black box models for evaluating climate change impacts on crop yield. Agricult. For. Meteorol. 336, 109458. https://doi.org/10.1016/j.agrformet.2023.109458 (2023).
  30. Priyatikanto, R., Lu, Y., Dash, J. & Sheffield, J. Improving generalisability and transferability of machine-learning-based maize yield prediction model through domain adaptation. Agricult. For. Meteorol. 341, 109652. https://doi.org/10.1016/j.agrformet.2023. 109652 (2023).
  31. von Bloh, M. et al. Machine learning for soybean yield forecasting in Brazil. Agricult. For. Meteorol. 341, 109670. https://doi.org/ 10.1016/j.agrformet.2023.109670 (2023).
  32. Liu, N. et al. Meshless surface wind speed field reconstruction based on machine learning. Adv. Atmos. Sci. 39, 1721-1733. https:// doi.org/10.1007/s00376-022-1343-8 (2022).
  33. Li, Y. et al. Convective storm VIL and lightning nowcasting using satellite and weather radar measurements based on multi-task learning models. Adv. Atmos. Sci. 40, 887-899. https://doi.org/10.1007/s00376-022-2082-6 (2023).
  34. Yang, D. et al. Predictor selection for CNN-based statistical downscaling of monthly precipitation. Adv. Atmos. Sci. 40, 1117-1131. https://doi.org/10.1007/s00376-022-2119-x (2023).
  35. Wang, T. & Huang, P. Superiority of a convolutional neural network model over dynamical models in predicting central pacific ENSO. Adv. Atmos. Sci. 40, 1-14. https://doi.org/10.1007/s00376-023-3001-1 (2023).
  36. Zou, H., Wu, S. & Tian, M. Radar quantitative precipitation estimation based on the gated recurrent unit neural network and echo-top data. Adv. Atmos. Sci. 40, 1043-1057. https://doi.org/10.1007/s00376-022-2127-x (2023).
  37. Bi, K. et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533-538. https://doi.org/ 10.1038/s41586-023-06185-3 (2023).
  38. Zhang, Y. et al. Skilful nowcasting of extreme precipitation with NowcastNet. Nature 619, 526-532. https://doi.org/10.1038/ s41586-023-06184-4 (2023).
  39. Ham, Y.-G. et al. Anthropogenic fingerprints in daily precipitation revealed by deep learning. Nature https://doi.org/10.1038/ s41586-023-06474-x (2023).
  40. Shamekh, S., Lamb, K. D., Huang, Y. & Gentine, P. Implicit learning of convective organization explains precipitation stochasticity. Proc. Natl. Acad. Sci. 120, e2216158120. https://doi.org/10.1073/pnas. 2216158120 (2023).
  41. Pinheiro Gomes, E., Progênio, M. F. & da Silva Holanda, P. Modeling with artificial neural networks to estimate daily precipitation in the Brazilian Legal Amazon. Clim. Dyn. https://doi.org/10.1007/s00382-024-07200-7 (2024).
  42. Papantoniou, S. & Kolokotsa, D.-D. Prediction of outdoor air temperature using neural networks: Application in 4 European cities. Energy Build. 114, 72-79. https://doi.org/10.1016/j.enbuild.2015.06.054 (2016).
  43. Roebber, P. Toward an adaptive artificial neural network-based postprocessor. Mon. Weather Rev. https://doi.org/10.1175/MWR-D-21-0089.1 (2021).
  44. Chen, Y. et al. Prediction of ENSO using multivariable deep learning. Atmos. Ocean. Sci. Lett. 16, 100350. https://doi.org/10.1016/j. aosl.2023.100350 (2023).
  45. Baño-Medina, J., Manzanas, R. & Gutiérrez, J. M. Configuration and intercomparison of deep learning neural models for statistical downscaling. Geosci. Model Dev. 13, 2109-2124. https://doi.org/10.5194/gmd-13-2109-2020 (2020).
  46. Zhong, H. et al. Prediction of instantaneous yield of bio-oil in fluidized biomass pyrolysis using long short-term memory network based on computational fluid dynamics data. J. Clean. Prod. 391, 136192. https://doi.org/10.1016/j.jclepro.2023.136192 (2023).
  47. Jiang, N., Yu, X. & Alam, M. A hybrid carbon price prediction model based-combinational estimation strategies of quantile regression and long short-term memory. J. Clean. Prod. https://doi.org/10.1016/j.jclepro.2023.139508 (2023).
  48. Guo, Y. et al. Stabilization temperature prediction in carbon fiber production using empirical mode decomposition and long short-term memory network. J. Clean. Prod. https://doi.org/10.1016/j.jclepro.2023.139345 (2023).
  49. Yang, C.-H., Chen, P.-H., Wu, C.-H., Yang, C.-S. & Chuang, L.-Y. Deep learning-based air pollution analysis on carbon monoxide in Taiwan. Ecol. Inform. https://doi.org/10.1016/j.ecoinf.2024.102477 (2024).
  50. Yang, X. et al. A spatio-temporal graph-guided convolutional LSTM for tropical cyclones precipitation nowcasting. Appl. Soft Comput. 124, 109003. https://doi.org/10.1016/j.asoc.2022.109003 (2022).
  51. Ham, Y.-G., Kim, J.-H. & Luo, J.-J. Deep learning for multi-year ENSO forecasts. Nature 573, 568-572. https://doi.org/10.1038/ s41586-019-1559-7 (2019).
  52. Xie, W., Xu, G., Zhang, H. & Dong, C. Developing a deep learning-based storm surge forecasting model. Ocean Model. 182, 102179. https://doi.org/10.1016/j.ocemod.2023.102179 (2023).
  53. Hu, W. et al. Deep learning forecast uncertainty for precipitation over the Western United States. Mon. Weather Rev. 151, 13671385. https://doi.org/10.1175/MWR-D-22-0268.1 (2023).
  54. Wang, C. & Li, X. A deep learning model for estimating tropical cyclone wind radius from geostationary satellite infrared imagery. Mon. Weather Rev. 151, 403-417. https://doi.org/10.1175/MWR-D-22-0166.1 (2023).
  55. Ling, F. et al. Multi-task machine learning improves multi-seasonal prediction of the Indian Ocean Dipole. Nat. Commun. 13, 7681. https://doi.org/10.1038/s41467-022-35412-0 (2022).
  56. Sun, W. et al. Artificial intelligence forecasting of marine heatwaves in the south China sea using a combined U-Net and ConvLSTM system. Remote Sens. 15, 4068 (2023).
  57. Sun, X. et al. PN-HGNN: Precipitation nowcasting network via hypergraph neural networks. IEEE Trans. Geosci. Remote Sens. 62, 1-12. https://doi.org/10.1109/TGRS.2024.3407157 (2024).
  58. Harnist, B., Pulkkinen, S. & Mäkinen, T. DEUCE v1.0: A neural network for probabilistic precipitation nowcasting with aleatoric and epistemic uncertainties. Geosci. Model Dev. 17, 3839-3866. https://doi.org/10.5194/gmd-17-3839-2024 (2024).
  59. Beucler, T. et al. Climate-invariant machine learning. Sci. Adv. 10, eadj7250. https://doi.org/10.1126/sciadv.adj7250 (2024).
  60. Kontolati, K., Goswami, S., Em Karniadakis, G. & Shields, M. D. Learning nonlinear operators in latent spaces for real-time predictions of complex dynamics in physical systems. Nat. Commun. 15, 5101. https://doi.org/10.1038/s41467-024-49411-w (2024).
  61. Chen, H. et al. Visibility forecast in Jiangsu province based on the GCN-GRU model. Sci. Rep. 14, 12599. https://doi.org/10.1038/ s41598-024-61572-8 (2024).
  62. Pan, S. et al. Oil well production prediction based on CNN-LSTM model with self-attention mechanism. Energy 284, 128701. https://doi.org/10.1016/j.energy.2023.128701 (2023).
  63. Dehghani, A. et al. Comparative evaluation of LSTM, CNN, and ConvLSTM for hourly short-term streamflow forecasting using deep learning approaches. Ecol. Inform. 75, 102119. https://doi.org/10.1016/j.ecoinf.2023.102119 (2023).
  64. Boulila, W., Ghandorh, H., Khan, M. A., Ahmed, F. & Ahmad, J. A novel CNN-LSTM-based approach to predict urban expansion. Ecol. Inform. 64, 101325. https://doi.org/10.1016/j.ecoinf.2021.101325 (2021).
  65. Lima, F. T. & Souza, V. M. A. A large comparison of normalization methods on time series. Big Data Res. 34, 100407. https://doi. org/10.1016/j.bdr.2023.100407 (2023).
  66. Liu, K. et al. New methods based on a genetic algorithm back propagation (GABP) neural network and general regression neural network (GRNN) for predicting the occurrence of trihalomethanes in tap water. Sci. Total Environ. 870, 161976. https://doi.org/ 10.1016/j.scitotenv.2023.161976 (2023).
  67. Khaldi, R., El Afia, A., Chiheb, R. & Tabik, S. What is the best RNN-cell structure to forecast each time series behavior?. Expert Syst. Appl. 215, 119140. https://doi.org/10.1016/j.eswa.2022.119140 (2023).
  68. Chandrasekar, A., Zhang, S. & Mhaskar, P. A hybrid Hubspace-RNN based approach for modelling of non-linear batch processes. Chem. Eng. Sci. 281, 119118. https://doi.org/10.1016/j.ces.2023.119118 (2023).
  69. Al Mehedi, M. A. et al. Predicting the performance of green stormwater infrastructure using multivariate long short-term memory (LSTM) neural network. J. Hydrol. 625, 130076. https://doi.org/10.1016/j.jhydrol.2023.130076 (2023).
  70. Ma, J., Ding, Y., Cheng, J. C. P., Jiang, F. & Wan, Z. A temporal-spatial interpolation and extrapolation method based on geographic Long Short-Term Memory neural network for PM2.5. J. Clean. Prod. 237, 117729. https://doi.org/10.1016/j.jclepro.2019.117729 (2019).
  71. Sejuti, Z. A. & Islam, M. S. A hybrid CNN-KNN approach for identification of COVID-19 with 5-fold cross validation. Sensors Int. 4, 100229. https://doi.org/10.1016/j.sintl.2023.100229 (2023).
  72. Guo, Q. et al. Air pollution forecasting using artificial and wavelet neural networks with meteorological conditions. Aerosol Air Qual. Res. 20, 1429-1439. https://doi.org/10.4209/aaqr.2020.03.0097 (2020).
  73. Bilgili, M., Ozbek, A., Yildirim, A. & Simsek, E. Artificial neural network approach for monthly air temperature estimations and maps. J. Atmos. Solar-Terr. Phys. 242, 106000. https://doi.org/10.1016/j.jastp. 2022.106000 (2023).
  74. Hrisko, J., Ramamurthy, P., Yu, Y., Yu, P. & Melecio-Vázquez, D. Urban air temperature model using GOES-16 LST and a diurnal regressive neural network algorithm. Remote Sens. Environ. 237, 111495. https://doi.org/10.1016/j.rse.2019.111495 (2020).
  75. Yu, X., Shi, S. & Xu, L. A spatial-temporal graph attention network approach for air temperature forecasting. Appl. Soft Comput. 113, 107888. https://doi.org/10.1016/j.asoc.2021.107888 (2021).
  76. Zhang, X., Xiao, Y., Zhu, G. & Shi, J. A coupled CEEMD-BiLSTM model for regional monthly temperature prediction. Environ. Monitor. Assess. 195, 379. https://doi.org/10.1007/s10661-023-10977-5 (2023).
  77. Zhang, X., Ren, H., Liu, J., Zhang, Y. & Cheng, W. A monthly temperature prediction based on the CEEMDAN-BO-BiLSTM coupled model. Sci. Rep. https://doi.org/10.1038/s41598-024-51524-7 (2024).
  78. Song, C., Chen, X., Wu, P. & Jin, H. Combining time varying filtering based empirical mode decomposition and machine learning to predict precipitation from nonlinear series. J. Hydrol. 603, 126914. https://doi.org/10.1016/j.jhydrol.2021.126914 (2021).
  79. Priestly, S. E., Raimond, K., Cohen, Y., Brema, J. & Hemanth, D. J. Evaluation of a novel hybrid lion swarm optimization-AdaBoostRegressor model for forecasting monthly precipitation. Sustain. Comput. Inform. Syst. 39, 100884. https://doi.org/10.1016/j. suscom.2023.100884 (2023).
  80. Tao, L., He, X., Li, J. & Yang, D. A multiscale long short-term memory model with attention mechanism for improving monthly precipitation prediction. J. Hydrol. 602, 126815. https://doi.org/10.1016/j.jhydrol.2021.126815 (2021).
  81. Rajendra, P., Murthy, K. V. N., Subbarao, A. & Boadh, R. Use of ANN models in the prediction of meteorological data. Model. Earth Syst. Environ. 5, 1051-1058. https://doi.org/10.1007/s40808-019-00590-2 (2019).
  82. Hanoon, M. S. et al. Developing machine learning algorithms for meteorological temperature and humidity forecasting at Terengganu state in Malaysia. Sci. Rep. 11, 18935. https://doi.org/10.1038/s41598-021-96872-w (2021).
  83. Gurlek, C. Artificial neural networks approach for forecasting of monthly relative humidity in Sivas, Turkey. J. Mech. Sci. Technol. 37, 4391-4400. https://doi.org/10.1007/s12206-023-0753-6 (2023).
  84. Shad, M., Sharma, Y. D. & Singh, A. Forecasting of monthly relative humidity in Delhi, India, using SARIMA and ANN models. Model. Earth Syst. Environ. 8, 4843-4851. https://doi.org/10.1007/s40808-022-01385-8 (2022).
  85. Ozbek, A., Unal, Ş& Bilgili, M. Daily average relative humidity forecasting with LSTM neural network and ANFIS approaches. Theor. Appl. Climatol. 150, 697-714. https://doi.org/10.1007/s00704-022-04181-7 (2022).
  86. Rahimikhoob, A. Estimating sunshine duration from other climatic data by artificial neural network for ET0 estimation in an arid environment. Theor. Appl. Climatol. 118, 1-8. https://doi.org/10.1007/s00704-013-1047-1 (2014).
  87. Kandirmaz, H. M., Kaba, K. & Avci, M. Estimation of monthly sunshine duration in Turkey using artificial neural networks. Int. J. Photoenergy 2014, 680596. https://doi.org/10.1155/2014/680596 (2014).

الشكر والتقدير

تم دعم هذا البحث من قبل مؤسسة شاندونغ للعلوم الطبيعية (رقم المنحة ZR2023MD075) و LAC/CMA (رقم المنحة 2023B02) ومؤسسة المختبر الوطني الرئيسي للتربة والجيولوجيا الرباعية (رقم المنحة SKLLQG2211) وبرنامج العلوم الإنسانية والاجتماعية في التعليم العالي بمقاطعة شاندونغ (رقم المنحة J18RA196) ومؤسسة العلوم الطبيعية الوطنية في الصين (رقم المنحة 41572150) وبرنامج دعم أعضاء هيئة التدريس الشبان للابتكارات العلمية والتكنولوجية في مؤسسات التعليم العالي بمقاطعة شاندونغ (رقم المنحة 2021KJ085).

مساهمات المؤلفين

قدم Q.G. البيانات. قام Q.G. و Z.H. بتصميم التجارب، وقام Q.G. و Z.H. بتنفيذ التجارب، وقام Q.G. و Z.H. و Z.W. بتحليل النتائج. راجع جميع المؤلفين المخطوطة.

المصالح المتنافسة

يعلن المؤلفون عدم وجود مصالح متنافسة.

معلومات إضافية

يجب توجيه المراسلات والطلبات للحصول على المواد إلى Q.G.
معلومات إعادة الطبع والتصاريح متاحة على www.nature.com/reprints.
ملاحظة الناشر تظل Springer Nature محايدة فيما يتعلق بالمطالبات القضائية في الخرائط المنشورة والانتماءات المؤسسية.
الوصول المفتوح هذه المقالة مرخصة بموجب ترخيص المشاع الإبداعي للاستخدام غير التجاري، والذي يسمح بأي استخدام غير تجاري، ومشاركة، وتوزيع، وإعادة إنتاج في أي وسيلة أو شكل، طالما أنك تعطي الائتمان المناسب للمؤلفين الأصليين والمصدر، وتوفر رابطًا لترخيص المشاع الإبداعي، وتوضح إذا قمت بتعديل المادة المرخصة. ليس لديك إذن بموجب هذا الترخيص لمشاركة المواد المعدلة المشتقة من هذه المقالة أو أجزاء منها. الصور أو المواد الأخرى من طرف ثالث في هذه المقالة مشمولة في ترخيص المشاع الإبداعي للمقالة، ما لم يُشار إلى خلاف ذلك في سطر ائتمان للمادة. إذا لم تكن المادة مشمولة في ترخيص المشاع الإبداعي للمقالة واستخدامك المقصود غير مسموح به بموجب اللوائح القانونية أو يتجاوز الاستخدام المسموح به، ستحتاج إلى الحصول على إذن مباشرة من صاحب حقوق الطبع والنشر. لعرض نسخة من هذا الترخيص، قم بزيارة http://creativecommons.org/licenses/by-nc-nd/4.0/.
© المؤلفون 2024

  1. كلية الجغرافيا والبيئة، جامعة لياوتشينغ، لياوتشينغ 252000، الصين. معهد دراسات هوانغهي، جامعة لياوتشينغ، لياوتشينغ 252000، الصين. المختبر الرئيسي للكيمياء الجوية، الإدارة الوطنية للأرصاد الجوية، بكين 100081، الصين. المختبر الوطني الرئيسي للتربة والجيولوجيا الرباعية، معهد بيئة الأرض، الأكاديمية الصينية للعلوم، شيآن 710061، الصين. مركز بيانات علوم النظام البيئي الوطني، المختبر الرئيسي لمراقبة الشبكات البيئية والنمذجة، معهد العلوم الجغرافية وبحوث الموارد الطبيعية، الأكاديمية الصينية للعلوم، بكين 100101، الصين. البريد الإلكتروني: guogingchun@Icu.edu.cn

Journal: Scientific Reports, Volume: 14, Issue: 1
DOI: https://doi.org/10.1038/s41598-024-68906-6
PMID: https://pubmed.ncbi.nlm.nih.gov/39085577
Publication Date: 2024-07-31

Monthly climate prediction using deep convolutional neural network and long short-term memory

Qingchun Guo , Zhenfang & Zhaosheng Wang

Abstract

Climate change affects plant growth, food production, ecosystems, sustainable socio-economic development, and human health. The different artificial intelligence models are proposed to simulate climate parameters of Jinan city in China, include artificial neural network (ANN), recurrent NN (RNN), long short-term memory neural network (LSTM), deep convolutional NN (CNN), and CNN-LSTM. These models are used to forecast six climatic factors on a monthly ahead. The climate data for 72 years (1 January 1951-31 December 2022) used in this study include monthly average atmospheric temperature, extreme minimum atmospheric temperature, extreme maximum atmospheric temperature, precipitation, average relative humidity, and sunlight hours. The time series of 12 month delayed data are used as input signals to the models. The efficiency of the proposed models are examined utilizing diverse evaluation criteria namely mean absolute error, root mean square error (RMSE), and correlation coefficient (R). The modeling result inherits that the proposed hybrid CNNLSTM model achieves a greater accuracy than other compared models. The hybrid CNN-LSTM model significantly reduces the forecasting error compared to the models for the one month time step ahead. For instance, the RMSE values of the ANN, RNN, LSTM, CNN, and CNN-LSTM models for monthly average atmospheric temperature in the forecasting stage are and , respectively. The findings of climate simulations shows the potential of CNN-LSTM models to improve climate forecasting. Climate prediction will contribute to meteorological disaster prevention and reduction, as well as flood control and drought resistance.

Climate change affects soil development, plant growth, food security, water safety, air quality, traffic safety, tourism, agricultural production, forest fire, flood, ecosystems, renewable energy sources, energy management, sustainable socio-economic development, and human health . Especially, extreme rainfall and temperature events often lead to serious disasters such as drought, mudslides and floods . Climate change is having adverse effects on crop productivity . Climate change is also the main driving factor for the annual growth of trees. The increment of tree growth decreases with the increase of daily maximum temperature, but increases with the increase of relative humidity . The global average annual air temperature in 2023 is higher than pre-industrial levels (1850-1900). Moreover, the average air temperature from 2014 to 2023 is higher than the temperature (1850-1900) (World Meteorological Organization). The Paris Agreement aims to control the global average temperature rise lower than pre-industrial levels by , and strives to limit the temperature rise to within . If humans significantly reduce greenhouse gas emissions and accelerate carbon neutrality, we still have the potential to avoid the worst climate disasters. Meanwhile, robust long-term climate predictions contribute to the formulation of climate management policies. Compared to seasonal forecasting, skillfully predicting monthly averages has significant social importance, and predictive information can be incorporated into time sensitive decisions, such as agricultural, urban, energy and reservoir management practices . However, current climate model forecast is not satisfying yet . Therefore, accurate climate prediction is an
urgent scientific issue that needs to be addressed. The sub seasonal time scale, ranging from approximately two weeks to three months, is often described as a “predictable desert” due to a lack of predictive skills.
Artificial intelligence (AI) models have been widely applied in multidisciplinary fields . With the deepening of research, AI models are able to explore the context of time series and have been introduced into climate modeling . Machine Learning (ML) models provide a new perspective to climate forecasting . Artificial Neural Network (ANN) and Recurrent NN (RNN) are adapted to predict of outdoor air temperature in four European cities. ANNs are used to estimate precipitation in the Brazilian Legal Amazon . The comparison of measured and predicted air temperature confirms the accurate training of the neural networks . ANNs have nonlinear generalizability and predictive ability . A deep learning algorithm is employed to predict the El Niño-Southern Oscillation (ENSO). At the six-month lead, the performance of the DL is significantly better than the multi-models . Deep learning (DL) NN models are used for statistical downscaling . Long short-term memory (LSTM) can learn nonlinear relationships with long-term dependencies, which may be difficult for traditional ML and NN models to capture . A convolutional LSTM is developed for precipitation nowcasting . The correlation skill of the Nino3.4 index of the convolutional neural networks (CNN) model is higher than those of current dynamical forecast systems . The CNN could more accurately forecast future storm surges . The CNN has been found to have the potential to extract spatial information from high-resolution predictions. It has been successfully applied to predict precipitation and tropical cyclone wind radius . The MTL-NET model is utilized to forecast the Indian Ocean Dipole (IOD). The MTL-NET can forecast the IOD seven month ahead, outperforming most of climate dynamical models. The multi-task learning model (MTL-NET) contains four convolutional layers, two maximum pooling layers, and a LSTM layer . The ConvLSTM and U-Net models are utilized to forecast Marine heatwaves (MHWs) in the the South China Sea (SCS) region. The innovative forecasting system gives better predictions of . The Precipitation Nowcasting Network Via Hypergraph Neural Networks (PN-HGNN) is first adopted for precipitation forecasts . The probabilistic method (DEUCE) integrates Bayesian neural networks and the U-Net to predicting precipitation . Climate-invariant machine learning is proposed to predict climate . The latent deep operator network (L-DeepONet) is used to forecast weather and climate . The GCN-GRU (Graph Convolutional Network and Gated Recurrent Unit) is used to forecast visibility weather . Nevertheless, Establishing robust artificial intelligence models for climate predicting remains a challenging task as there is still no clear understanding of climate data.
In summary, artificial intelligence can be used to predict climate variables and its predictive performance has been evaluated. The LSTM model, as an artificial intelligence method, has also made certain progress in predicting climate factors. CNN is one of the most representative network structures in DL. Compared with other DL approaches, CNN has stronger feature extraction and information mining capabilities. Combining CNN and LSTM can more effectively extract spatiotemporal features from input data. The experimental results show that the combined CNN-LSTM model has better prediction accuracy than independent LSTM and CNN models . Various ANN, RNN, LSTM and CNN methods are employed to predict climate factors. However, the comparison between the multiple climatic elements prediction results of artificial intelligence models (ANN, RNN, LSTM, CNN, and CNN-LSTM) in the jinan city is not clear. This study conducted in-depth exploration and experimentations to find the best climate simulation model. In this article, we use a set of climate datasets to demonstrate that the CNN-LSTM hybrid model is an effective climate prediction system and can be applied to various climate prediction problems in principle.
In this study, CNN-LSTM was applied to predict climate time series. The proposed CNN-LSTM hybrid scheme was mainly tested in Jinan City to predict monthly climate factors. The following research issues are addressed: (1) What are the skills of the CNN-LSTM hybrid method compared to traditional ANN methods? (2) What are the hyperparameters of the CNN-LSTM hybrid model? (3) Is the CNN-LSTM hybrid solution of practical significance in East China? By answering these questions, the author aims to develop more proficient climate forecasting and introduce artificial intelligence methods into climate forecasting on a broader scale, inspiring future creative work.

Study area and data
section*{Study area}

Jinan is located in East China, central Shandong, and the southeast edge of North China Plain (Fig. 1). Jinan belongs to the continental monsoon climate zone. Jinan has excellent agricultural resources and a long tradition of vegetable cultivation, earning the reputation of “China’s high-quality vegetable basket”. In 2022, the total agricultural output value was 52.6 billion yuan, with a total grain output of 2.962 million tons. Jinan has completed afforestation of 773.3 hectares and forest nurturing of 5333.3 hectares, with over 60 families and more than 300 types of tree and shrub resources.

Data and data standardization

The monthly climatological data during 1951-2022 in Jinan city are obtained from the meteorological platform (http://www.nmic.cn/). The monthly climatological data include average atmospheric temperature (AT), extreme minimum atmospheric temperature, extreme maximum atmospheric temperature, precipitation , average relative humidity ( RH ), and sunlight hours ( SH ).
The climatological datasets are partitioned into three divisions for calibration (training) ( ) (from January 1951 to October 2008), verification (10%) (from November 2008 to November 2015), and testing (predicting) (10%) (from December 2015 to December 2022). Then, three divisions sets are standardized to ensure uniformity among the climatological data. This helps to improve the prediction accuracy of the artificial intelligence models. At the training phase, the optimal parameter values for the artificial intelligence models are assigned. At the
Figure 1. Location Map of the research area. The map is generated using ArcGIS Pro 2.5 (ArcGIS Pro), URL: https://www.esriuk.com.
prediction period, the standardized data are offered to the networks to climate forecast. At the predicting phase, the climatic elements are accurately predicted by the models.
In order to improve the training speed of the artificial intelligence models and the prediction accuracy, it needs standardization of the climate data and unify its value range between 0 and . The formula is as follows:
where, is the normalized climate data, represents the -th value of the original climate data, expresses the maximum value of the climate sequence, Lmin expresses the minimum value of the climate sequence.

Methodology

Artificial neural network (ANN)

A three-layer back propagation (BP) ANN consists of a single input layer, a single hidden layer and a single output layer (Fig. 2). The artificial neurons (nodes) in each layer of the BPANN are closely connected with nodes in other layers .
The output value of each layer is estimated by the following equation:
where is the output of the ith node; f means activation function (transfer function); a is the number of nodes; Wij represents weight; Xj and bt is input of the jth neuron and threshold of nodes.
The error is calculated based on the forecasted and expected outputs. The mean square error (MSE) of the ANN is calculated using the equation:
where and Kg are respectively the number of training climate data, the expected and actual output of the gth sample, and the actual output of the gth sample.
Figure 2. Structure of ANN model.
Four kinds of activation functions (transfer functions) are typically logsig (Sigmoid) in Eq. (4), purelin in Eq. (5), tansig (tanh) in Eq. (6) and Rectified Linear Unit (ReLU, or positive linear transfer function(poslin)) in Eq. (7), respectively.
After model training and validation, the settings of the model have been determined. The input variables are 12 , the output variable is 1 , and the neurons of hidden layer are 5 . The activation functions are logsig and purelin, and training algorithm is trainbr. The learning rate is 0.001 , epochs are 100 and the goal is .

Recurrent neural network (RNN)

Memory loss is the main drawback of feedforward artificial neural networks. To overcome this limitation, Recurrent Neural Networks (RNNs) integrate the feedback connections into their structure . The RNNs employ an internal state to solve sequential climate time series forecasting.
Transferring information from one neuron to the next. For example, the last hidden state and the recent input give the recent hidden state in Eq. (8). The recent output extracts features from in Eq. (9) .
where are the weights, and and are the biases.
Similarly, the parameters of the model are set. The input variables are 12, the output variable is 1 , and the neurons of hidden layer are 8. The activation functions are tansig for hidden layer and purelin for output layer. training function is trainlm. learning function is learngdm. Performance function mse is .

Long short-term memory neural network (LSTM)

LSTM is the most popular method in climate prediction, and used to address long-term dependency issues in RNN. Moreover, LSTM can more widely capture nonlinear features in climate data through three gates. The LSTM can be trained utilizing climate data to forecast climate change. The input gate determines how much input can be stored in the memory unit. The forgetting gate controls how much climate data from the last memory unit should be trashed. The output gate determines how much output from the memory unit. These gates operate together to regulate the climate data and assist LSTM in capturing and processing long-term dependencies in climate data. By utilizing multiple gates to filter the climate data, short-term memory ( ) and long-term memory ( ) are processed. Therefore, LSTM can recall data on diverse timescales, making it suitable for climate forecast .
Figure 3 illustrates the structural framework of the LSTM cell (unit). Inputs of the cell comprise the climate information , the hidden state of the previous cell and the cell state of the previous cell . Outputs of the unit include the hidden state and the unit state , which are regulated by the forget gate , the input gate , and the output gate . The regulating course and the outputs of the cell are calculated as follows:
where and are the coefficient (Weight) and bias vector.
Similarly, the hyperparameters of the model are set. The input size is 12 , the number of output is 1 , and the number of hidden units is 100 . The activation functions are tanh and sigmoid. The Adam Optimizer is used and the learning rate is set to 0.001 . The goal is .
Figure 3. The cell logic structure of the LSTM network.

Convolutional neural network (CNN)

CNN includes convolutional computation and has a deep structure (Fig. 4). Compared with ANNs, the advantage of the CNN is that it can improve the ability to extract inputting features by increasing depth. The operation steps for the CNN include: (a) after inputting the data into CNN, a large number of features are extracted and weights were reduced through several convolutions and pooling; (b) Transforming the features into regression results of nodes through a fully connected layer; (c) the CNN uses a resharing mechanism to assign the same weights to different neurons, thereby using the sum of the same weights, which reduces the number of parameters . To process the input through layers, neurons, and activation functions, the ReLU is utilized. Normalization techniques are used to avoid overfitting. The Adam Optimizer is used and the learning rate is set to 0.001 . The goal is . Epochs of trainning parameter are 200. Batch sizes are 20.

CNN-LSTM

Figure 5 describes the climate simulation process using CNN-LSTM. Weight sharing and local receptive fields are the ways in which CNN learns the features of climate data. The output characteristics of each time step in the LSTM models are extracted through a gate mechanism. The fully connected layer of time distribution does not only obtain the output of the last time step, but also obtains the output of all time steps. On this foundation, this article puts forward a regression system for climate modeling using CNN and LSTM networks.
This proposed CNN-LSTM model is directly fed the 3D climate data, and its shape is . In the first convolutional layer, shapes of convolutional kernels are and stride is 1 , which allows to extract abstract features of the climate data. In the second layer (max pooling layer), their shapes are and their stride is 1 . The third and fourth layers are respectively batch normalization and ReLU. In convolutional Layer 2, 32 kernels in the size of . To reduce the size of the feature matrix, followed a max-pooling layer, which has a size
Figure 4. Basic structure diagram of CNN.
Figure 5. The CNN-LSTM architecture.
of with 1 stride. One LSTM layer is utilized in the model. the LSTM contain 100 neurons. LSTM layers are translated into the features using a fully connected layer. Finally, a regression layer is employed to predict climatic element. Epochs of trainning parameter are 200. Batch sizes are 20. The learning rate is 0.005 , and the Adam Optimizer is used.

Experiment

Cross-validation

Fivefold cross validation is utilized to avoid overfitting. The validation climate data are utilized for part-to-part training and validation. The dats are divided into five parts. The folding process is repeated five times. In the 1st fold, is utilized for validation and for training. Similarly, in the 2nd fold, is utilized for validation. Therefore, by folding the climate data, overfitting of the artificial intelligence models is prevented. Because it uses different training climate data each time, it does not lean towards the training climate data. Therefore, overfitting issues can be prevented .

Evaluation criteria

Performance evaluation of the different models is performed, by comparing the differences between the observed and simulated climate values. The various parameter metrics namely Pearson correlation coefficient (R), root mean square error (RMSE), and mean absolute error (MAE) are utilized. The different methods such as ANN, RNN, LSTM, CNN, and the CNN-LSTM are applied to get high performance . Calculations of R, RMSE and MAE are in following equations.
where Lm is the value of observed climate data, Om is the predicted climate value, and I is the length of climate data. is the average of the observed climate data, represents the average of the forecasted climate values.

Simulating monthly average atmospheric temperature

The models have a “input-output” structure, where output is climatic element for month and inputs are climatic element in t and t – s previous months. Through periodic analysis, the cycle of climate factors is 11 . Meanwhile, there are 12 months in a year. Therefore, the input variables are 12. The models are used to simulate and forecast the climate changes of 1-time-step ahead for monthly time scale. The data from the past 12 months are used as input for the five models, and the next 1 month data is used as output for the five models.
The simulation results of the different algorithms in the ANN are shown in Table 1. Comparing the results, it can be seen that their training performances have significant differences. Trainbr has the highest , the lowest RMSE (1.8199), and the lowest MAE (1.4787). The trainbr algorithm also performs well in the validation stage, with R ( 0.9870 ), RMSE ( 1.9923 ) and MAE ( 1.6352 ), respectively. In the prediction phase, R, RMSE, and MAE of trainbr are respectively , and 1.8042 , indicating its good generalization ability.
The simulation results of different combinations of training functions (tansig (T), purelin (PU), logsig (L), poslin (PO)) are shown in Table 2. The combination (logsig-purelin) training results have the lowest RMSE and MAE values, and the highest R value, indicating a successful combination. In addition, this combination also performs well in cross validation stage and has good generalization ability in the prediction stage.
Table 3 illustrates the statistical results achieved using various artificial intelligence models (ANN, RNN, LSTM, CNN) and the proposed CNN-LSTM model in terms of different evaluation indicators namely R, RMSE, and MAE in training stage, verification stage and predicting stage. The proposed CNN-LSTM approach attains monthly average atmospheric temperature prediction accuracy with and a minimal error in RMSE (0.6292) and MAE (0.5048). This indicates the CNN-LSTM model is well effective than other in monthly average atmospheric temperature prediction. The minimum prediction error is achieved by the CNN-LSTM model compared to other artificial intelligence models. The lower the predicting error, the greater will be predicting accuracy and performance. The hybrid CNN-LSTM model performed better than the four models in simulating the average atmospheric temperature for one month ahead.
Figures 6 represent the predicted monthly average atmospheric temperature with respect to different models. The predicted value of the hybrid CNN-LSTM model is very close to the actual value. The five models can efficiently capture the monthly average atmospheric temperature trends as well as peaks. However, the performance of the CNN-LSTM model at simulating the monthly average atmospheric temperature is optimal.

Comparison of observed and simulated monthly extreme minimum atmospheric temperature

Table 4 compares observed and simulated monthly extreme minimum atmospheric temperature using the best ANN, RNN, LSTM, CNN and CNN-LSTM models for one month ahead simulated during the three periods. It is worth noting that the five models have better performance in the calibration (training) period, the verification period and predicting period according to R, RMSE and MAE values. The CNN-LSTM model is the most accurate monthly extreme minimum atmospheric temperature forecast that offers one step ahead based on R, RMSE and MAE performance criteria. The value of R, RMSE and MAE are respectively and
Training functions R RMSE ( ) MAE ( )
Training Verification Predicting Training Verification Predicting Training Verification Predicting
Trainbr 0.9894 0.9870 0.9907 1.8199 1.9923 2.0669 1.4787 1.6352 1.8042
Trainlm 0.9891 0.9865 0.9903 1.8280 1.9947 2.2055 1.5286 1.6417 1.8223
Traingdx 0.9848 0.9831 0.9865 2.5865 2.6032 2.6232 2.0750 2.1694 2.2884
Traingd 0.9843 0.9829 0.9863 3.3718 3.3298 3.2961 2.7721 2.8332 2.8319
Traingdm 0.9869 0.9845 0.9875 2.5335 2.5701 2.5395 2.0509 2.1454 2.1707
Traingda 0.9857 0.9839 0.9867 2.2270 2.3107 2.4912 1.8536 1.9816 2.1897
Trainrp 0.9871 0.9856 0.9890 1.8872 1.9955 2.4071 1.6493 1.6761 1.8887
Traincgp 0.9888 0.9853 0.9804 1.8347 1.9958 2.5255 1.6806 1.6718 1.8886
Traincgf 0.9887 0.9857 0.9802 1.8494 1.9955 2.4166 1.6243 1.6572 1.8801
Traincgb 0.9797 0.9777 0.9808 2.1680 2.1577 2.9158 1.7103 1.7804 1.8576
Trainscg 0.9876 0.9852 0.9802 1.8518 1.9958 2.4130 1.6286 1.6853 1.8755
Trainbfg 0.9878 0.9853 0.9880 1.8462 1.9946 2.4086 1.6244 1.6922 1.8613
Trainoss 0.9880 0.9854 0.9889 1.8350 1.9957 2.5366 1.6653 1.6671 1.8932
Table 1. Comparison between various training algorithms in the ANN model.
Transfer functions R RMSE ( ) MAE ( )
Training Verification Predicting Training Verification Predicting Training Verification Predicting
T-PU 0.9889 0.9859 0.9904 1.8382 1.9949 2.1373 1.5046 1.6413 1.8125
T-L 0.9879 0.9848 0.9902 1.8355 1.9950 2.2910 1.5057 1.6517 1.8210
T-T 0.9869 0.9839 0.9901 1.8351 1.9959 2.2873 1.5060 1.6516 1.8193
L-PU 0.9894 0.9870 0.9907 1.8199 1.9923 2.0669 1.4787 1.6352 1.8042
L-T 0.9859 0.9829 0.9898 1.8353 1.9949 2.2873 1.5056 1.6416 1.8142
L-L 0.9849 0.9818 0.9903 1.8354 1.9950 2.2829 1.5056 1.6621 1.8309
PU-T 0.9878 0.9827 0.9883 1.8575 1.9962 2.5771 1.5228 1.6723 1.8228
PU-L 0.9877 0.9855 0.9873 1.8780 1.9986 2.8339 1.5411 1.6646 1.8557
PU-PU 0.9886 0.9856 0.9886 1.8524 1.9968 2.5028 1.5191 1.6829 1.8258
T-PO 0.9839 0.9828 0.9902 1.8373 1.9951 2.2934 1.5070 1.6916 1.8309
L-PO 0.9829 0.9882 0.9898 1.8356 1.9952 2.3004 1.5063 1.6519 1.8211
PO-PO 0.9819 0.9818 0.9892 1.8440 1.9954 2.4584 1.5120 1.6514 1.8281
PU-PO 0.9886 0.9856 0.9886 1.8690 1.9985 2.8205 1.5344 1.6648 1.8544
PO-L 0.9885 0.9857 0.9868 1.8527 1.9959 2.6051 1.5186 1.6721 1.8304
PO-PU 0.9850 0.9848 0.9892 1.8439 1.9953 2.4593 1.5120 1.6814 1.8209
PO-T 0.9879 0.9827 0.9900 1.8396 1.9957 2.4249 1.5081 1.6519 1.8218
Table 2. Comparison between various transfer functions in the ANN model.
Models R RMSE ( ) MAE ( )
Training Verification Predicting Training Verification Predicting Training Verification Predicting
ANN 0.9894 0.9870 0.9907 1.8199 1.9923 2.0669 1.4787 1.6352 1.8042
RNN 0.9905 0.9881 0.9895 1.3891 1.5245 1.4416 1.0836 1.1594 1.1917
LSTM 0.9906 0.9870 0.9914 1.3819 1.5965 1.3482 1.0710 1.2278 1.1485
CNN 0.9968 0.9965 0.9969 0.8148 0.8249 0.8015 0.6387 0.6290 0.6680
CNN-LSTM 0.9982 0.9982 0.9981 0.6422 0.6270 0.6292 0.5043 0.4726 0.5048
Table 3. Comparison analysis between various models for simulated monthly average atmospheric temperature.
Figure 6. Comparison of observed and predicted values of monthly average atmospheric temperature in Jinan from 2015 to 2022. (a) Plot of the prediction results, (b) Scatterplot of the prediction results.
while training the CNN-LSTM model with of basic data. The CNN-LSTM has nicely forecasted the monthly extreme minimum atmospheric temperature with the R of 0.9970 , RMSE of , MAE of , respectively.
Figure 7 represents simulated results of the five artificial intelligence models for one-time-step-ahead extreme minimum atmospheric temperature forecasted in the prediction period. The five models capture the temporal variations and the peaks of the monthly extreme minimum atmospheric temperature. However, the performance of the CNN-LSTM model at simulating the monthly extreme minimum atmospheric temperature is optimal.
Models R RMSE ( ) MAE ( )
Training Verification Predicting Training Verification Predicting Training Verification Predicting
ANN 0.9790 0.9741 0.9696 2.1874 2.3985 2.6238 1.7348 1.8691 1.9254
RNN 0.9782 0.9733 0.9709 2.3703 2.5951 2.8135 1.9171 2.0651 2.2372
LSTM 0.9806 0.9769 0.9719 2.1011 2.2587 2.5320 1.6674 1.6604 1.9572
CNN 0.9942 0.9936 0.9942 1.1576 1.1977 1.1528 0.9102 0.9197 0.8200
CNN-LSTM 0.9971 0.9973 0.9970 0.8350 0.7785 0.8287 0.6583 0.5809 0.5979
Table 4. Comparison analysis between various models for simulated monthly extreme minimum atmospheric temperature.
Figure 7. Comparison of observed and predicted values of monthly extreme minimum atmospheric temperature in Jinan from 2015 to 2022. (a) Plot of the prediction results, (b) Scatterplot of the prediction results.

Comparison of observed and simulated monthly extreme maximum atmospheric temperature

Table 5 shows the R, MSE and RMSE of the five models for forecasting one time step in the training, verification and testing periods. The CNN-LSTM model has the slightest error and the most correlation in simulating monthly extreme maximum atmospheric temperature in the calibration, verification and predicting periods. Simulated results in the predicting stage for the R, RMSE and MAE criterion values for the CNN-LSTM model in the one step ahead are and , respectively. However, the forecasting results at one month ahead for ANN, RNN, and LSTM and CNN models are acceptable. The CNN-LSTM model performs better than the ANN, RNN, LSTM, and CNN models. For instance, the RMSE values in the predicting period for the best ANN, RNN, LSTM, and CNN models, to forecast monthly extreme maximum atmospheric temperature one time-steps-ahead , and , respectively, are obtained.
Figure 8 compares observed and forecasted extreme maximum atmospheric temperature using the ANN, RNN, LSTM, CNN and CNN-LSTM models for one-time-step-ahead forecasted in the predicting stage in the monthly time scale. The results indicate that CNN-LSTM model with good accuracy forecasted extreme maximum atmospheric temperature peaks. In general, the CNN-LSTM model forecasts in one time step are better than the ANN, RNN, LSTM, and CNN models.
Models R RMSE ( ) MAE ( )
Training Verification Predicting Training Verification Predicting Training Verification Predicting
ANN 0.9647 0.9621 0.9689 2.4269 2.5132 2.2345 1.8372 1.9768 1.6627
RNN 0.9643 0.9611 0.9666 2.4806 2.5762 2.2979 1.9156 2.0481 1.6812
LSTM 0.9668 0.9591 0.9709 2.3452 2.6012 2.1666 1.8163 2.0398 1.6583
CNN 0.9948 0.9950 0.9962 0.9446 0.9604 0.8212 0.7346 0.7354 0.6202
CNN-LSTM 0.9987 0.9982 0.9987 0.5339 0.6213 0.4932 0.4216 0.4848 0.3931
Table 5. Comparison analysis between various models for simulated monthly extreme maximum atmospheric temperature.
Figure 8. Comparison of observed and predicted values of monthly extreme maximum atmospheric temperature in Jinan from 2015 to 2022. (a) Plot of the prediction results, (b) Scatterplot of the prediction results.

Comparison of observed and simulated monthly precipitation

Table 6 represent the R analysis, MAE and RMSE analysis respectively with respect to the five models. The error values (MAE and RMSE) achieved by the CNN-LSTM model are less when compared to other four models such as ANN, RNN, LSTM, and CNN. The MAE and RMSE values achieved by the CNN-LSTM model in predicting period are 8.1762 mm and 6.7051 mm , respectively. The R values of the proposed CNN-LSTM model is 0.9962 which is larger compared to other existing models. From ANN to CNN-LSTM model, the RMSE and MAE decrease, and R increases.
Figure 9 shows the predicted results of five models and actual precipitation. The figure shows clearly that the overall performance of CNN-LSTM model is superior to ANN, RNN, LSTM, and CNN models. The trends of CNN and CNN-LSTM have better agreement with observations than ANN, RNN, and LSTM models. Moreover, Fig. 4 indicates that ANN model performs less than the RNN and LSTM models. The ANN model cannot efficiently capture the monthly precipitation trends as well as the peaks and it has a poor correlation with the
Models R RMSE (mm) MAE (mm)
Training Verification Predicting Training Verification Predicting Training Verification Predicting
ANN 0.6853 0.6823 0.7092 58.7736 56.3767 67.4976 39.8891 34.4801 42.5787
RNN 0.7412 0.7452 0.7590 53.0472 50.2847 62.1261 33.1355 29.3883 37.7565
LSTM 0.7685 0.7246 0.7672 50.6978 52.4807 60.5523 32.5079 31.4153 36.0748
CNN 0.9691 0.9629 0.9857 20.2432 22.5777 16.8436 13.8417 13.8229 11.8683
CNN-LSTM 0.9952 0.9930 0.9962 7.8252 8.8947 8.1762 6.0644 6.7083 6.7051
Table 6. Comparison analysis between various models for simulated monthly precipitation.
Figure 9. Comparison of observed and predicted values of monthly precipitation in Jinan from 2015 to 2022. (a) Plot of the prediction results, (b) Scatterplot of the prediction results.
observed precipitation. The ANN simulation cannot meet climate simulation objective, while the CNN and CNN-LSTM simulated results can.

Comparison of observed and simulated monthly average relative humidity

Table 7 represents the R, RMSE, MAE for the five models. The best CNN-LSTM with the slightest value RMSE and MAE and the most value R is selected in both the verification and predicting stages. In Table 5, the RMSE, MAE, and R criteria values for the CNN-LSTM model in predicting stages are and 0.9984 , respectively.
Figure 10 shows the superior performance of the CNN-LSTM over the ANN, RNN, LSTM, and CNN models in forecasting monthly average relative humidity. The CNN-LSTM hybrid model has been able to simulate and predict relative humidity peaks well.

Comparison of observed and simulated monthly sunlight hours

Table 8 shows the R, RMSE and MAE values of the ANN, RNN, LSTM, and CNN, CNN-LSTM models in training, verification and predicting stages. The optimized CNN-LSTM model in predicting stage has better assessment criteria, with , respectively.
Figure 11 shows results comparing the observed and predicted monthly sunlight (sunshine) hours using the ANN, RNN, LSTM, and CNN, CNN-LSTM models for one month ahead predicting during the predicting period. Also, the forecasted values of the CNN-LSTM model are more compact in the proximity of the observed values, compared to the ANN, RNN, LSTM, and CNN models. this means better performance of the CNN-LSTM model.
Models R RMSE (%) MAE (%)
Training Verification Predicting Training Verification Predicting Training Verification Predicting
ANN 0.7444 0.7452 0.7672 7.9631 8.6807 7.4171 6.3622 6.9138 5.9593
RNN 0.7693 0.7549 0.7874 7.6236 8.3876 7.0419 6.0314 6.5664 5.6321
LSTM 0.7779 0.7862 0.7934 7.4957 7.8915 6.9580 6.0077 6.0309 5.4739
CNN 0.9935 0.9943 0.9919 1.4208 1.4384 1.4513 1.0988 1.0889 1.1419
CNN-LSTM 0.9988 0.9987 0.9984 0.6222 0.7171 0.6615 0.4991 0.5546 0.5093
Table 7. Comparison analysis between various models for simulated monthly average relative humidity.
Figure 10. Comparison of observed and predicted values of monthly average relative humidity in Jinan from 2015 to 2022. (a) Plot of the prediction results, (b) Scatterplot of the prediction results.
Models R RMSE (hour) MAE (hour)
Training Verification Predicting Training Verification Predicting Training Verification Predicting
ANN 0.7095 0.5295 0.6413 34.9436 41.8596 37.4016 27.9570 32.7740 29.7778
RNN 0.7468 0.6156 0.6752 32.9704 38.7314 36.1896 26.7097 30.6143 28.6519
LSTM 0.7515 0.5801 0.7192 32.6550 39.9885 33.9022 26.3996 30.9942 27.0269
CNN 0.9903 0.9940 0.9939 7.0557 5.7520 5.6467 5.5325 4.5937 4.3742
CNN-LSTM 0.9984 0.9988 0.9984 2.9650 2.5824 2.9058 2.3491 2.0115 2.3794
Table 8. Comparison analysis between various models for simulated monthly sunlight hours.
Figure 11. Comparison of observed and predicted values of monthly sunlight hours in Jinan from 2015 to 2022. (a) Plot of the prediction results, (b) Scatterplot of the prediction results.

Comparison with other literatures

It can be inferred from Tables and 6 that the CNN-LSTM model improves the CNN and LSTM models, for its RMSE and MAE are smaller and R is larger than CNN and LSTM models in training, verification and testing stages. Therefore, model performance can be ranked from high to low as: CNNLSTM > CNN > LSTM > RNN > ANN. The generalization ability of the five models is consistent with their fitting performance rank. The CNN-LSTM model provides strong guarantee for the flexibility in capturing inherit features of climate data.
In addition to the intuitive error metrics described above, we also calculated the average running time by recording 100 random runs of each model, and the running results are recorded in Table 9. Among all the models, CNN-LSTM is the most computationally expensive model, and ANN is the least computationally expensive model. However, CNN-LSTM increases in prediction accuracy.
Different artificial intelligence models have been applied to climate prediction in different regions. The RMSE and values of the Feed-forward neural network (FNN) model for the monthly minimum atmospheric temperature (Tmin) prediction in Türkiye were calculated as about and 0.98 for the testing process, respectively. The value of of the FNN model for the monthly maximum air temperature (Tmax) prediction was calculated as 0.9928 , whereas the RMSE value was obtained as . The FNN is more successful than the Elman neural network (ENN) in modeling Tmin, Tmax and monthly mean air temperature (T) . A diurnal regressive NN algorithm is presented to predict urban air temperature in the U.S. Statistics generate a bias of 0.8 K , an RMSE of 2.6 K , and of . The atmospheric temperature forecasting GATG model integrates the graph attention network (GAT) module and the gated recurrent unit (GRU) cell. When the predicting length is 96 h in china, the RMSE, MAE, and Correlation Coefficient (CORR) results of the GATG model are about 3.161, 2.849, and 0.831, respectively . The CEEMD-BiLSTM is builded using CEEMD (complementary ensemble empirical mode decomposition) and BiLSTM (directional LSTM), and it is used to predict monthly temperature in Zhengzhou City. The average relative error of the CEEMD-BiLSTM is about . The performance indicates that the model has a good prediction quality . The CEEMDAN-BO-BiLSTM model has a MAE of 1.17, and a RMSE of 1.43 for monthly mean air temperature in Jinan City . Our model’s prediction accuracy is similar to those of these models.
Precipitation (P) series have unpredictable randomness and nonlinear. Consequently, the accurate prediction of P is very laborious. For improving P series forecast accuracy, P data is decomposed into some subcomponents through different decomposition approaches (wavelet transform (WT), time varying filtering (TVF-EMD), and CEEMD). Then, the ENN is used to construct, WT-ENN, TVF-EMD-ENN, and CEEMD-ENN models to forecast the subcomponents of P. Finally, the models are applied to P series in twelve different regions in China. The predictions by TVF-EMD-ENN are better than those of WT-ENN and CEEMD-ENN . A hybrid monthly P prediction model (ABR-LSO) is built by integrating the AdaBoostRegressor (ABR) with the Lion Swarm Optimization (LSO) algorithm. RMSE and MAE values of the ABR-LSO are 52.39 and 39.89 in in Idukki, India . A multiscale LSTM model with attention mechanism (MLSTM-AM) is employed to improve the accuracy of monthly precipitation prediction. The average Nash-Sutcliffe efficiency (NSE) and relative absolute error (RAE) in the YRB for the model are 0.66 and 0.35 . The performance of the MLSTM-AM is better than the LSTM, MLSTM, and multiple linear regression (MLR) . Our model has higher prediction accuracy than these models.
Two ANN models namely radial base function (RBF) and multiple layer perceptron (MLP) are employed for the forecasts of hourly and monthly meteorological variables in Ongole and Hyderabad, India. The RBF and
Models ANN RNN LSTM CNN CNN-LSTM
Average elapsed time 17 18 19 40 89
Table 9. Average time for each model run.
MLP have given about accuracy for the forecasts of air temperature (AT), and soil temperature (ST) and relative humidity (RH). In addition, the predictions demonstrated a strong correlation with the recorded data in between about 0.61 and .
The different machine learning algorithms are used to predict AT and RH at Terengganu state in Malaysia. The multi-layered perceptron (MLP-NN) performs well in forecasting daily RH and AT with R of about 0.633 and 0.713, respectively. However, in monthly forecast AT, MLP-NN can be utilized to forecast monthly AT with R of about 0.846 . Whereas in prediction monthly RH, the efficiency of radial basis function (RBF-NN) is higher than other models with R of about 0.711 . The results indicate that there is great potential for predicting AT and RH values with an acceptable range of accuracy on either architecture of the ANN . The ANNs are used to predict monthly relative humidity (RH) in Sivas Province, Turkey. The R, MAE, and RMSE values ranged between about , and , respectively. The results show that the ANN provides satisfactory predictions for monthly . The seasonal autoregressive moving average (SARIMA) and ANN models are utilized to forecast the monthly RH in Delhi, India. The SARIMA model provides the predicted RH with RMSE of about 6.0 and MAE of about 4.6. However, ANN model reported the predicted RH with RMSE of about 4.7 and MAE of about 3.4. The ANN is more reliable for forecasting RH than SARIMA . The LSTM and adaptive neuro-fuzzy inference system (ANFIS) are used to forecast one day ahead of RH in Turkey. In the testing period, the MAE, R and RMSE values of the LSTM are and , respectively, in Erzurum province. Moreover, their values are and , respectively, in Erzurum province using the ANFIS. The results indicate that the ANFIS and LSTM perform satisfactory performance in RH prediction . Our model has lower prediction errors than these models.
ANNs are used to estimate sunshine duration (SD) in Iran. Average determination coefficient ( ), mean bias error (MBE), RMSE for the comparison between measured and estimated SD are calculated resulting and , respectively . Three different ANN models, namely, general regression NN (GRNN), MLP, and RBF, are used in the estimation of sunshine duration (SD) in Turkey. The average of estimated SD is about 6.795 h 6.772 h , and 0.672 h by MLP, GRNN and RBF with mean bias error (MBE) and -0.054 h , percentage mean absolute error (MAPE) and , RMSE , and 1.128 , percentage root mean square error (%RMSE) and and R is found to be and 0.890 , respectively. Statistical indicators show that MLP and GRNN models produce better results than the RBF . Our model has higher prediction accuracy than these models.
In this article, we propose a more effective method to predict the monthly climate of Jinan city. The proposed method is based on the fusion of CNN and LSTM models. In order to further evaluate the predictive effectiveness of the CNN-LSTM model, the prediction results of the CNN-LSTM model are compared with the other three models (ANN, RNN, LSTM, and CNN). In summary, in the performance comparison of the five models, it can be seen that CNN-LSTM can better handle nonlinear and non-stationary climate signals. For the processing of climate time series, the LSTM is suitable for the forecast of nonlinear climate data, and it can further improve the forecast accuracy of the CNN. In addition, the LSTM model can capture a series of climate information before and after, which is more conducive to the prediction of non smooth and nonlinear climate time series. Considering the advantages of these two models, the constructed CNN-LSTM model is feasible for predicting nonlinear climate sequences with better predictive performance and higher accuracy. Consequently, the CNNLSTM runs best in climate forecast, further indicating that the CNN-LSTM is effective and feasible for forecasting non-stationary climate data. When proposing, testing, and evaluating this new method, we intend to provide decision support for future rational planning, especially flood control and disaster reduction.

Conclusion

(1) The potential of artificial intelligence models for monthly climate factors prediction during 1951-2022 in Jinan city is investigated in this study. The novel climate prediction model “CNN-LSTM” is presented to accurately predict climatic elements based on historical data. The effectiveness of the CNN-LSTM is validated by climate data in Jinan city. The performance of the CNN-LSTM is investigated using three evaluation indicators namely MAE, R and RMSE.
(2) The CNN-LSTM is compared with ANN, RNN, LSTM, and CNN utilizing the same monthly climate data. The input variables lag times are derived from the cycle of monthly climate data. The performance achieved by the CNN-LSTM model is greater than other compared artificial intelligence models (ANN, RNN, LSTM, CNN). The prediction results of CNN-LSTM model is superior to other models in generalization ability and precision. This indicates the effectiveness of the proposed CNN-LSTM model over other existing artificial intelligence models. This means that compared to other models, the CNN-LSTM has the lowest RMSE and MAE values and the highest R value.
(3) In climate change monitoring, extreme climate is of extraordinary importance, and the CNN-LSTM model also has higher efficiency than other four models in extreme climate prediction. The surveys show that predicted extreme air temperature is more accurate than predicted precipitation. The CNN model is close to CNN-LSTM model in some single coefficients but the errors demonstrate that the CNN-LSTM has more stable performance. The CNN-LSTM can reasonably predict the magnitude and monthly variations in climate elements, capture the peaks of the climate data, and meet the evaluation criteria of model performance. The CNN-LSTM is a promising approach for climate simulation.

Limitations and suggestions

(1) The simulated monthly climate values of the hybrid CNN-LSTM model are substantially similar to the observed climate values, but there are some differences which require more accurate multi-time scale climate data. This study only considered historical climate data of the month as the input variable for the model. Therefore, building hourly model requires a higher resolution data. The application of accurate multi-time scale climate data can provide improvements in the climate prediction.
(2) In future, the prediction accuracy of CNN-LSTM will also compare with current physics-based dynamical models. The models can be further extended by applying the decomposition techniques (WT, TVF-EMD, and CEEMD), bidirectional LSTM (BiLSTM), transfer learning, bidirectional GRU (BiGRU), and considering the residual components of climate data as input for the models development. The performance of climate modeling will be further improved by exploring multi-time scales, spatial features and other factors such as solar radiation, greenhouse temperature, terrain, vegetation, El Niño-Southern Oscillation, etc. This strategy can be utilized for any prediction application to make short-term, medium-term, and longterm operational plans. Therefore, the robustness of the models can be utilized to forecast multi-time scale climatic elements. In the simulation and prediction of different extreme climates, we will integrate multiple data such as remote sensing and ground observations for spatiotemporal multi-scale climate modeling. In the process of climate modeling, we will integrate physical mechanisms into machine learning models to improve the interpretability and generalization ability of the models. It provides a new technological approach for the combination of traditional physical models and advanced artificial intelligence algorithms.

Data availability

Data and materials are available from the corresponding author upon request.
Received: 27 May 2024; Accepted: 29 July 2024
Published online: 31 July 2024

References

  1. Guo, Q., He, Z. & Wang, Z. Change in air quality during 2014-2021 in Jinan City in China and its influencing factors. Toxics 11, 210 (2023).
  2. Guo, Q., He, Z. & Wang, Z. Long-term projection of future climate change over the twenty-first century in the Sahara region in Africa under four Shared Socio-Economic Pathways scenarios. Environ. Sci. Pollut. Res. 30, 22319-22329. https://doi.org/10.1007/ s11356-022-23813-z (2023).
  3. Guo, Q. et al. Changes in air quality from the COVID to the post-COVID era in the Beijing-Tianjin-Tangshan region in China. Aerosol Air Qual. Res. 21, 210270. https://doi.org/10.4209/aaqr. 210270 (2021).
  4. Zhao, R. et al. Assessing resilience of sustainability to climate change in China’s cities. Sci. Total Environ. 898, 165568. https://doi. org/10.1016/j.scitotenv.2023.165568 (2023).
  5. Zheng, Y. et al. Assessing the impacts of climate variables on long-term air quality trends in Peninsular Malaysia. Sci. Total Environ. 901, 166430. https://doi.org/10.1016/j.scitotenv.2023.166430 (2023).
  6. Zhou, S., Yu, B. & Zhang, Y. Global concurrent climate extremes exacerbated by anthropogenic climate change. Sci. Adv. 9, eabo1638. https://doi.org/10.1126/sciadv.abo1638 (2023).
  7. Zurek, M., Hebinck, A. & Selomane, O. Climate change and the urgency to transform food systems. Science 376, 1416-1421. https:// doi.org/10.1126/science.abo2364 (2022).
  8. Klisz, M. et al. Local site conditions reduce interspecific differences in climate sensitivity between native and non-native pines. Agricult. For. Meteorol. 341, 109694. https://doi.org/10.1016/j.agrformet. 2023.109694 (2023).
  9. Li, X. et al. Attribution of runoff and hydrological drought changes in an ecologically vulnerable basin in semi-arid regions of China. Hydrol. Process. https://doi.org/10.1002/hyp. 15003 (2023).
  10. Xue, B. et al. Divergent hydrological responses to forest expansion in dry and wet basins of China: Implications for future afforestation planning. Water Resour. Res. 58, e2021WR031856. https://doi.org/10.1029/2021WR031856 (2022).
  11. Guo, Q., He, Z. & Wang, Z. The characteristics of air quality changes in Hohhot City in China and their relationship with meteorological and socio-economic factors. Aerosol Air Qual. Res. 24, 230274. https://doi.org/10.4209/aaqr. 230274 (2024).
  12. Wang, Y., Hu, K., Huang, G. & Tao, W. Asymmetric impacts of El Niño and La Niña on the Pacific-North American teleconnection pattern: The role of subtropical jet stream. Environ. Res. Lett. 16, 114040. https://doi.org/10.1088/1748-9326/ac31ed (2021).
  13. Abbas, G. et al. Modeling the potential impact of climate change on maize-maize cropping system in semi-arid environment and designing of adaptation options. Agricult. For. Meteorol. 341, 109674. https://doi.org/10.1016/j.agrformet.2023.109674 (2023).
  14. Mangani, R., Gunn, K. M. & Creux, N. M. Projecting the effect of climate change on planting date and cultivar choice for South African dryland maize production. Agricult. For. Meteorol. 341, 109695. https://doi.org/10.1016/j.agrformet.2023.109695 (2023).
  15. Liang, R., Sun, Y., Qiu, S., Wang, B. & Xie, Y. Relative effects of climate, stand environment and tree characteristics on annual tree growth in subtropical Cunninghamia lanceolata forests. Agricult. For. Meteorol. 342, 109711. https://doi.org/10.1016/j.agrformet. 2023.109711 (2023).
  16. Kumar, A., Chen, M. & Wang, W. An analysis of prediction skill of monthly mean climate variability. Clim. Dyn. 37, 1119-1131. https://doi.org/10.1007/s00382-010-0901-4 (2011).
  17. Chen, Y. et al. Improving the heavy rainfall forecasting using a weighted deep learning model. Front. Environ. Sci. https://doi.org/ 10.3389/fenvs.2023.1116672 (2023).
  18. Guo, Q., He, Z. & Wang, Z. Predicting of daily PM2.5 concentration employing wavelet artificial neural networks based on meteorological elements in Shanghai, China. Toxics 11, 51 (2023).
  19. He, Z., Guo, Q., Wang, Z. & Li, X. Prediction of monthly PM2.5 concentration in Liaocheng in China employing artificial neural network. Atmosphere 13, 1221 (2022).
  20. Guo, Q. & He, Z. Prediction of the confirmed cases and deaths of global COVID-19 using artificial intelligence. Environ. Sci. Pollut. Res. 28, 11672-11682. https://doi.org/10.1007/s11356-020-11930-6 (2021).
  21. Guo, Q., He, Z. & Wang, Z. Simulating daily PM2.5 concentrations using wavelet analysis and artificial neural network with remote sensing and surface observation data. Chemosphere 340, 139886. https://doi.org/10.1016/j.chemosphere.2023.139886 (2023).
  22. Guo, Q., He, Z. & Wang, Z. Prediction of hourly PM2.5 and PM10 concentrations in Chongqing City in China based on artificial neural network. Aerosol Air Qual. Res. 23, 220448. https://doi.org/10.4209/aaqr. 220448 (2023).
  23. Fang, S. et al. MS-Net: Multi-source spatio-temporal network for traffic flow prediction. IEEE Trans. Intell. Transp. Syst. 23, 7142-7155. https://doi.org/10.1109/TITS.2021.3067024 (2022).
  24. Rajasundrapandiyanleebanon, T., Kumaresan, K., Murugan, S., Subathra, M. S. P. & Sivakumar, M. Solar energy forecasting using machine learning and deep learning techniques. Arch. Comput. Methods Eng. 30, 3059-3079. https://doi.org/10.1007/s11831-023-09893-1 (2023).
  25. Han, Y. et al. Novel economy and carbon emissions prediction model of different countries or regions in the world for energy optimization using improved residual neural network. Sci. Total Environ. 860, 160410. https://doi.org/10.1016/j.scitotenv.2022. 160410 (2023).
  26. Wang, H. et al. Scientific discovery in the age of artificial intelligence. Nature 620, 47-60. https://doi.org/10.1038/s41586-023-06221-2 (2023).
  27. Nathvani, R. et al. Beyond here and now: Evaluating pollution estimation across space and time from street view images with deep learning. Sci. Total Environ. https://doi.org/10.1016/j.scitotenv.2023.166168 (2023).
  28. Faraji, M., Nadi, S., Ghaffarpasand, O., Homayoni, S. & Downey, K. An integrated 3D CNN-GRU deep learning method for shortterm prediction of PM2.5 concentration in urban environment. Sci. Total Environ. 834, 155324. https://doi.org/10.1016/j.scitotenv. 2022.155324 (2022).
  29. Hu, T. et al. Crop yield prediction via explainable AI and interpretable machine learning: Dangers of black box models for evaluating climate change impacts on crop yield. Agricult. For. Meteorol. 336, 109458. https://doi.org/10.1016/j.agrformet.2023.109458 (2023).
  30. Priyatikanto, R., Lu, Y., Dash, J. & Sheffield, J. Improving generalisability and transferability of machine-learning-based maize yield prediction model through domain adaptation. Agricult. For. Meteorol. 341, 109652. https://doi.org/10.1016/j.agrformet.2023. 109652 (2023).
  31. von Bloh, M. et al. Machine learning for soybean yield forecasting in Brazil. Agricult. For. Meteorol. 341, 109670. https://doi.org/ 10.1016/j.agrformet.2023.109670 (2023).
  32. Liu, N. et al. Meshless surface wind speed field reconstruction based on machine learning. Adv. Atmos. Sci. 39, 1721-1733. https:// doi.org/10.1007/s00376-022-1343-8 (2022).
  33. Li, Y. et al. Convective storm VIL and lightning nowcasting using satellite and weather radar measurements based on multi-task learning models. Adv. Atmos. Sci. 40, 887-899. https://doi.org/10.1007/s00376-022-2082-6 (2023).
  34. Yang, D. et al. Predictor selection for CNN-based statistical downscaling of monthly precipitation. Adv. Atmos. Sci. 40, 1117-1131. https://doi.org/10.1007/s00376-022-2119-x (2023).
  35. Wang, T. & Huang, P. Superiority of a convolutional neural network model over dynamical models in predicting central pacific ENSO. Adv. Atmos. Sci. 40, 1-14. https://doi.org/10.1007/s00376-023-3001-1 (2023).
  36. Zou, H., Wu, S. & Tian, M. Radar quantitative precipitation estimation based on the gated recurrent unit neural network and echo-top data. Adv. Atmos. Sci. 40, 1043-1057. https://doi.org/10.1007/s00376-022-2127-x (2023).
  37. Bi, K. et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533-538. https://doi.org/ 10.1038/s41586-023-06185-3 (2023).
  38. Zhang, Y. et al. Skilful nowcasting of extreme precipitation with NowcastNet. Nature 619, 526-532. https://doi.org/10.1038/ s41586-023-06184-4 (2023).
  39. Ham, Y.-G. et al. Anthropogenic fingerprints in daily precipitation revealed by deep learning. Nature https://doi.org/10.1038/ s41586-023-06474-x (2023).
  40. Shamekh, S., Lamb, K. D., Huang, Y. & Gentine, P. Implicit learning of convective organization explains precipitation stochasticity. Proc. Natl. Acad. Sci. 120, e2216158120. https://doi.org/10.1073/pnas. 2216158120 (2023).
  41. Pinheiro Gomes, E., Progênio, M. F. & da Silva Holanda, P. Modeling with artificial neural networks to estimate daily precipitation in the Brazilian Legal Amazon. Clim. Dyn. https://doi.org/10.1007/s00382-024-07200-7 (2024).
  42. Papantoniou, S. & Kolokotsa, D.-D. Prediction of outdoor air temperature using neural networks: Application in 4 European cities. Energy Build. 114, 72-79. https://doi.org/10.1016/j.enbuild.2015.06.054 (2016).
  43. Roebber, P. Toward an adaptive artificial neural network-based postprocessor. Mon. Weather Rev. https://doi.org/10.1175/MWR-D-21-0089.1 (2021).
  44. Chen, Y. et al. Prediction of ENSO using multivariable deep learning. Atmos. Ocean. Sci. Lett. 16, 100350. https://doi.org/10.1016/j. aosl.2023.100350 (2023).
  45. Baño-Medina, J., Manzanas, R. & Gutiérrez, J. M. Configuration and intercomparison of deep learning neural models for statistical downscaling. Geosci. Model Dev. 13, 2109-2124. https://doi.org/10.5194/gmd-13-2109-2020 (2020).
  46. Zhong, H. et al. Prediction of instantaneous yield of bio-oil in fluidized biomass pyrolysis using long short-term memory network based on computational fluid dynamics data. J. Clean. Prod. 391, 136192. https://doi.org/10.1016/j.jclepro.2023.136192 (2023).
  47. Jiang, N., Yu, X. & Alam, M. A hybrid carbon price prediction model based-combinational estimation strategies of quantile regression and long short-term memory. J. Clean. Prod. https://doi.org/10.1016/j.jclepro.2023.139508 (2023).
  48. Guo, Y. et al. Stabilization temperature prediction in carbon fiber production using empirical mode decomposition and long short-term memory network. J. Clean. Prod. https://doi.org/10.1016/j.jclepro.2023.139345 (2023).
  49. Yang, C.-H., Chen, P.-H., Wu, C.-H., Yang, C.-S. & Chuang, L.-Y. Deep learning-based air pollution analysis on carbon monoxide in Taiwan. Ecol. Inform. https://doi.org/10.1016/j.ecoinf.2024.102477 (2024).
  50. Yang, X. et al. A spatio-temporal graph-guided convolutional LSTM for tropical cyclones precipitation nowcasting. Appl. Soft Comput. 124, 109003. https://doi.org/10.1016/j.asoc.2022.109003 (2022).
  51. Ham, Y.-G., Kim, J.-H. & Luo, J.-J. Deep learning for multi-year ENSO forecasts. Nature 573, 568-572. https://doi.org/10.1038/ s41586-019-1559-7 (2019).
  52. Xie, W., Xu, G., Zhang, H. & Dong, C. Developing a deep learning-based storm surge forecasting model. Ocean Model. 182, 102179. https://doi.org/10.1016/j.ocemod.2023.102179 (2023).
  53. Hu, W. et al. Deep learning forecast uncertainty for precipitation over the Western United States. Mon. Weather Rev. 151, 13671385. https://doi.org/10.1175/MWR-D-22-0268.1 (2023).
  54. Wang, C. & Li, X. A deep learning model for estimating tropical cyclone wind radius from geostationary satellite infrared imagery. Mon. Weather Rev. 151, 403-417. https://doi.org/10.1175/MWR-D-22-0166.1 (2023).
  55. Ling, F. et al. Multi-task machine learning improves multi-seasonal prediction of the Indian Ocean Dipole. Nat. Commun. 13, 7681. https://doi.org/10.1038/s41467-022-35412-0 (2022).
  56. Sun, W. et al. Artificial intelligence forecasting of marine heatwaves in the south China sea using a combined U-Net and ConvLSTM system. Remote Sens. 15, 4068 (2023).
  57. Sun, X. et al. PN-HGNN: Precipitation nowcasting network via hypergraph neural networks. IEEE Trans. Geosci. Remote Sens. 62, 1-12. https://doi.org/10.1109/TGRS.2024.3407157 (2024).
  58. Harnist, B., Pulkkinen, S. & Mäkinen, T. DEUCE v1.0: A neural network for probabilistic precipitation nowcasting with aleatoric and epistemic uncertainties. Geosci. Model Dev. 17, 3839-3866. https://doi.org/10.5194/gmd-17-3839-2024 (2024).
  59. Beucler, T. et al. Climate-invariant machine learning. Sci. Adv. 10, eadj7250. https://doi.org/10.1126/sciadv.adj7250 (2024).
  60. Kontolati, K., Goswami, S., Em Karniadakis, G. & Shields, M. D. Learning nonlinear operators in latent spaces for real-time predictions of complex dynamics in physical systems. Nat. Commun. 15, 5101. https://doi.org/10.1038/s41467-024-49411-w (2024).
  61. Chen, H. et al. Visibility forecast in Jiangsu province based on the GCN-GRU model. Sci. Rep. 14, 12599. https://doi.org/10.1038/ s41598-024-61572-8 (2024).
  62. Pan, S. et al. Oil well production prediction based on CNN-LSTM model with self-attention mechanism. Energy 284, 128701. https://doi.org/10.1016/j.energy.2023.128701 (2023).
  63. Dehghani, A. et al. Comparative evaluation of LSTM, CNN, and ConvLSTM for hourly short-term streamflow forecasting using deep learning approaches. Ecol. Inform. 75, 102119. https://doi.org/10.1016/j.ecoinf.2023.102119 (2023).
  64. Boulila, W., Ghandorh, H., Khan, M. A., Ahmed, F. & Ahmad, J. A novel CNN-LSTM-based approach to predict urban expansion. Ecol. Inform. 64, 101325. https://doi.org/10.1016/j.ecoinf.2021.101325 (2021).
  65. Lima, F. T. & Souza, V. M. A. A large comparison of normalization methods on time series. Big Data Res. 34, 100407. https://doi. org/10.1016/j.bdr.2023.100407 (2023).
  66. Liu, K. et al. New methods based on a genetic algorithm back propagation (GABP) neural network and general regression neural network (GRNN) for predicting the occurrence of trihalomethanes in tap water. Sci. Total Environ. 870, 161976. https://doi.org/ 10.1016/j.scitotenv.2023.161976 (2023).
  67. Khaldi, R., El Afia, A., Chiheb, R. & Tabik, S. What is the best RNN-cell structure to forecast each time series behavior?. Expert Syst. Appl. 215, 119140. https://doi.org/10.1016/j.eswa.2022.119140 (2023).
  68. Chandrasekar, A., Zhang, S. & Mhaskar, P. A hybrid Hubspace-RNN based approach for modelling of non-linear batch processes. Chem. Eng. Sci. 281, 119118. https://doi.org/10.1016/j.ces.2023.119118 (2023).
  69. Al Mehedi, M. A. et al. Predicting the performance of green stormwater infrastructure using multivariate long short-term memory (LSTM) neural network. J. Hydrol. 625, 130076. https://doi.org/10.1016/j.jhydrol.2023.130076 (2023).
  70. Ma, J., Ding, Y., Cheng, J. C. P., Jiang, F. & Wan, Z. A temporal-spatial interpolation and extrapolation method based on geographic Long Short-Term Memory neural network for PM2.5. J. Clean. Prod. 237, 117729. https://doi.org/10.1016/j.jclepro.2019.117729 (2019).
  71. Sejuti, Z. A. & Islam, M. S. A hybrid CNN-KNN approach for identification of COVID-19 with 5-fold cross validation. Sensors Int. 4, 100229. https://doi.org/10.1016/j.sintl.2023.100229 (2023).
  72. Guo, Q. et al. Air pollution forecasting using artificial and wavelet neural networks with meteorological conditions. Aerosol Air Qual. Res. 20, 1429-1439. https://doi.org/10.4209/aaqr.2020.03.0097 (2020).
  73. Bilgili, M., Ozbek, A., Yildirim, A. & Simsek, E. Artificial neural network approach for monthly air temperature estimations and maps. J. Atmos. Solar-Terr. Phys. 242, 106000. https://doi.org/10.1016/j.jastp. 2022.106000 (2023).
  74. Hrisko, J., Ramamurthy, P., Yu, Y., Yu, P. & Melecio-Vázquez, D. Urban air temperature model using GOES-16 LST and a diurnal regressive neural network algorithm. Remote Sens. Environ. 237, 111495. https://doi.org/10.1016/j.rse.2019.111495 (2020).
  75. Yu, X., Shi, S. & Xu, L. A spatial-temporal graph attention network approach for air temperature forecasting. Appl. Soft Comput. 113, 107888. https://doi.org/10.1016/j.asoc.2021.107888 (2021).
  76. Zhang, X., Xiao, Y., Zhu, G. & Shi, J. A coupled CEEMD-BiLSTM model for regional monthly temperature prediction. Environ. Monitor. Assess. 195, 379. https://doi.org/10.1007/s10661-023-10977-5 (2023).
  77. Zhang, X., Ren, H., Liu, J., Zhang, Y. & Cheng, W. A monthly temperature prediction based on the CEEMDAN-BO-BiLSTM coupled model. Sci. Rep. https://doi.org/10.1038/s41598-024-51524-7 (2024).
  78. Song, C., Chen, X., Wu, P. & Jin, H. Combining time varying filtering based empirical mode decomposition and machine learning to predict precipitation from nonlinear series. J. Hydrol. 603, 126914. https://doi.org/10.1016/j.jhydrol.2021.126914 (2021).
  79. Priestly, S. E., Raimond, K., Cohen, Y., Brema, J. & Hemanth, D. J. Evaluation of a novel hybrid lion swarm optimization-AdaBoostRegressor model for forecasting monthly precipitation. Sustain. Comput. Inform. Syst. 39, 100884. https://doi.org/10.1016/j. suscom.2023.100884 (2023).
  80. Tao, L., He, X., Li, J. & Yang, D. A multiscale long short-term memory model with attention mechanism for improving monthly precipitation prediction. J. Hydrol. 602, 126815. https://doi.org/10.1016/j.jhydrol.2021.126815 (2021).
  81. Rajendra, P., Murthy, K. V. N., Subbarao, A. & Boadh, R. Use of ANN models in the prediction of meteorological data. Model. Earth Syst. Environ. 5, 1051-1058. https://doi.org/10.1007/s40808-019-00590-2 (2019).
  82. Hanoon, M. S. et al. Developing machine learning algorithms for meteorological temperature and humidity forecasting at Terengganu state in Malaysia. Sci. Rep. 11, 18935. https://doi.org/10.1038/s41598-021-96872-w (2021).
  83. Gurlek, C. Artificial neural networks approach for forecasting of monthly relative humidity in Sivas, Turkey. J. Mech. Sci. Technol. 37, 4391-4400. https://doi.org/10.1007/s12206-023-0753-6 (2023).
  84. Shad, M., Sharma, Y. D. & Singh, A. Forecasting of monthly relative humidity in Delhi, India, using SARIMA and ANN models. Model. Earth Syst. Environ. 8, 4843-4851. https://doi.org/10.1007/s40808-022-01385-8 (2022).
  85. Ozbek, A., Unal, Ş& Bilgili, M. Daily average relative humidity forecasting with LSTM neural network and ANFIS approaches. Theor. Appl. Climatol. 150, 697-714. https://doi.org/10.1007/s00704-022-04181-7 (2022).
  86. Rahimikhoob, A. Estimating sunshine duration from other climatic data by artificial neural network for ET0 estimation in an arid environment. Theor. Appl. Climatol. 118, 1-8. https://doi.org/10.1007/s00704-013-1047-1 (2014).
  87. Kandirmaz, H. M., Kaba, K. & Avci, M. Estimation of monthly sunshine duration in Turkey using artificial neural networks. Int. J. Photoenergy 2014, 680596. https://doi.org/10.1155/2014/680596 (2014).

Acknowledgements

This research was supported by Shandong Provincial Natural Science Foundation (Grant No. ZR2023MD075), LAC/CMA (Grant No. 2023B02), State Key Laboratory of Loess and Quaternary Geology Foundation (Grant No. SKLLQG2211), Shandong Province Higher Educational Humanities and Social Science Program (Grant No. J18RA196), the National Natural Science Foundation of China (Grant No. 41572150), and the Junior Faculty Support Program for Scientific and Technological Innovations in Shandong Provincial Higher Education Institutions (Grant No. 2021KJ085).

Author contributions

Q.G. provided the data. Q.G. and Z.H. conceived the experiments, Q.G. and Z.H.conducted the experiments, Q.G., Z.H. and Z.W. analyzed the results. All authors reviewed the manuscript.

Competing interests

The authors declare no competing interests.

Additional information

Correspondence and requests for materials should be addressed to Q.G.
Reprints and permissions information is available at www.nature.com/reprints.
Publisher’s note Springer Nature remains neutral with regard to jurisdictional claims in published maps and institutional affiliations.
Open Access This article is licensed under a Creative Commons Attribution-NonCommercialNoDerivatives 4.0 International License, which permits any non-commercial use, sharing, distribution and reproduction in any medium or format, as long as you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons licence, and indicate if you modified the licensed material. You do not have permission under this licence to share adapted material derived from this article or parts of it. The images or other third party material in this article are included in the article’s Creative Commons licence, unless indicated otherwise in a credit line to the material. If material is not included in the article’s Creative Commons licence and your intended use is not permitted by statutory regulation or exceeds the permitted use, you will need to obtain permission directly from the copyright holder. To view a copy of this licence, visit http://creativecommons.org/licenses/by-nc-nd/4.0/.
© The Author(s) 2024

  1. School of Geography and Environment, Liaocheng University, Liaocheng 252000, China. Institute of Huanghe Studies, Liaocheng University, Liaocheng 252000, China. Key Laboratory of Atmospheric Chemistry, China Meteorological Administration, Beijing 100081, China. State Key Laboratory of Loess and Quaternary Geology, Institute of Earth Environment, Chinese Academy of Sciences, Xi’an 710061, China. National Ecosystem Science Data Center, Key Laboratory of Ecosystem Network Observation and Modeling, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China. email: guogingchun@ Icu.edu.cn