طرق التعلم الآلي للتنبؤ بدرجة حرارة سطح البحر وحدوث موجات الحرارة البحرية: دراسة حالة للبحر الأبيض المتوسط
Machine learning methods to predict sea surface temperature and marine heatwave occurrence: a case study of the Mediterranean Sea

المجلة: Ocean science، المجلد: 20، العدد: 2
DOI: https://doi.org/10.5194/os-20-417-2024
تاريخ النشر: 2024-03-22
المؤلف: Giulia Bonino وآخرون
الموضوع الرئيسي: العمليات المحيطية والجوية

نظرة عامة

تقدم الدراسة إثبات مفهوم يوضح فعالية طرق التعلم الآلي (ML)، وخاصة شبكات الذاكرة طويلة وقصيرة المدى (LSTM)، في التنبؤ بدرجات حرارة سطح البحر (SST) وموجات الحرارة البحرية (MHWs) على مدى يصل إلى 7 أيام. تشير النتائج إلى أن أساليب التعلم الآلي يمكن أن تتفوق على النماذج الديناميكية التقليدية، مما يبرز قدرتها على التقاط العلاقات غير الخطية المعقدة في البيانات المحيطية.

يجب أن تركز الأبحاث المستقبلية على تحسين هذه النماذج من خلال معالجة القيود المتعلقة بمتوسط البيانات ودمج مجموعات بيانات ذات دقة أعلى. بالإضافة إلى ذلك، قد يؤدي دمج القوانين الفيزيائية في أطر التعلم الآلي إلى تحسين موثوقية التنبؤات. يمكن أن يؤدي توسيع نطاق البحث ليشمل المزيد من المتغيرات المحيطية إلى تعزيز فهم المحركات وراء موجات الحرارة البحرية. إن تطوير هذه الأدوات التنبؤية أمر حيوي لإدارة الاستزراع المائي والنظم البيئية بشكل استباقي، مما يمكّن المعنيين من تلقي تحذيرات في الوقت المناسب والتخفيف من الآثار البيئية المحتملة.

مقدمة

تؤكد مقدمة الورقة على الأهمية الحاسمة للتنبؤ بدقة بدرجات حرارة سطح البحر (SST) وموجات الحرارة البحرية (MHWs)، والتي تمثل أحداث extremes طويلة الأمد في SST تستمر لمدة لا تقل عن خمسة أيام. تشكل هذه الظواهر تحديات كبيرة للنظم البيئية البحرية والصناعات، مما يتطلب أساليب تنبؤ فعالة لدعم استراتيجيات الإدارة التكيفية. على الرغم من التقدم في أنظمة التنبؤ الديناميكية للمحيطات التي تعزز من دقة البيانات المكانية ودمج البيانات، إلا أن التنبؤ بالأنماط المحيطية والجوية التي تؤثر على تقلبات SST لا يزال معقدًا.

تقدم الاهتمامات الحديثة في تقنيات التعلم الآلي (ML) بدائل واعدة للنماذج الديناميكية التقليدية، حيث توفر كفاءة حسابية ودقة محسّنة في التنبؤ بـ SST و MHWs. تبرز الورقة مجموعة متنوعة من أساليب التعلم الآلي، بما في ذلك الأساليب السطحية مثل الانحدار الخطي والغابات العشوائية، بالإضافة إلى نماذج التعلم العميق مثل شبكات الذاكرة طويلة وقصيرة المدى (LSTM)، التي تناسب بشكل خاص بيانات السلاسل الزمنية. تم اختيار البحر الأبيض المتوسط كمنطقة دراسية بسبب ارتفاع معدل حدوث MHWs وأهميته للاستزراع المائي، الذي يتركز بشكل رئيسي في هذه المنطقة. تهدف الدراسة إلى إثبات فعالية طرق التعلم الآلي في التنبؤ بـ SST و MHWs حتى سبعة أيام مقدمًا، مع مقارنة هذه التنبؤات بتلك التي تم إنشاؤها بواسطة نظام التنبؤ المتوسطي كوبرنيكوس (MedFS). ستفصل الأقسام التالية المنهجية والنتائج والاستنتاجات لهذه البحث.

النتائج

في هذا القسم، يقيم المؤلفون القدرات التنبؤية لتقنيات التعلم الآلي (ML) لتنبؤات درجات حرارة سطح البحر (SST) وموجات الحرارة البحرية (MHW)، ممتدة حتى فترة زمنية تصل إلى 7 أيام. تستخدم التقييمات متوسط الجذر التربيعي للخطأ (RMSE) كمقياس للأداء لتنبؤات SST، بينما يتم استخدام درجة F1 لتقييم تنبؤات MHW، كما هو موضح في القسم 2.4 حول مقاييس التقييم. بالإضافة إلى ذلك، تفحص الدراسة حساسية نماذج التعلم الآلي فيما يتعلق بالمتغيرات المدخلة ضمن مجموعة بيانات الاختبار، مما يوفر رؤى حول قوة وموثوقية التنبؤات.

المناقشة

في هذه الدراسة، يتم استخدام تقنيات التعلم الآلي (ML) للتنبؤ بسلاسل زمنية لدرجات حرارة سطح البحر (SST) وموجات الحرارة البحرية (MHWs) عبر 16 منطقة من البحر الأبيض المتوسط. تستخدم الأبحاث مجموعة بيانات SST من مبادرة تغير المناخ التابعة لوكالة الفضاء الأوروبية، والتي توفر بيانات SST المستمدة من الأقمار الصناعية من 1981 إلى 2021، جنبًا إلى جنب مع المتغيرات الجوية من مجموعة بيانات ECMWF ERA5. تشمل المنهجية تحليل المعلومات المتبادلة لتحديد المتنبئين ذوي الصلة لـ SST، تليها تطبيق ثلاثة نماذج تعلم آلي: شبكات الذاكرة طويلة وقصيرة المدى (LSTM)، والشبكات العصبية التلافيفية أحادية البعد (CNN)، والغابات العشوائية (RForest). يتم تدريب هذه النماذج على البيانات التاريخية وتقييم دقتها التنبؤية باستخدام مقاييس مثل متوسط الجذر التربيعي للخطأ (RMSE) ودرجات F1 لاكتشاف MHW.

تشير النتائج إلى أن LSTM و RForest يتفوقان على CNN في التنبؤ بـ SST، خاصة في فترات التنبؤ القصيرة، حيث تظهر قيم RMSE زيادة مستمرة مع تمدد فترة التنبؤ. من الجدير بالذكر أن LSTM تظهر أعلى مهارة تنبؤية في معظم المناطق، بينما يظهر RForest أيضًا أداءً قويًا. كما تقيم الدراسة قدرات النماذج في التنبؤ بحدوث MHW، كاشفة أن جميع تقنيات التعلم الآلي عمومًا تقلل من تقديرات ذروة SST، مع درجات F1 تتجاوز 0.5، مما يشير إلى قدرات تنبؤية مرضية. تسلط تحليلات الحساسية الضوء على التأثير الكبير لـ SST نفسه على دقة التنبؤ، بينما تلعب الإشعاعات الشمسية الواردة والحرارة الكامنة أيضًا أدوارًا ملحوظة. بشكل عام، تشير النتائج إلى أن تقنيات التعلم الآلي يمكن أن تتنبأ بفعالية بـ SST و MHWs في البحر الأبيض المتوسط، مما يوفر بديلاً قيمًا للنماذج الديناميكية التقليدية.

Journal: Ocean science, Volume: 20, Issue: 2
DOI: https://doi.org/10.5194/os-20-417-2024
Publication Date: 2024-03-22
Author(s): Giulia Bonino et al.
Primary Topic: Oceanographic and Atmospheric Processes

Overview

The study presents a proof of concept demonstrating the efficacy of machine learning (ML) methods, particularly Long Short-Term Memory (LSTM) networks, in forecasting short-term sea surface temperature (SST) and marine heatwaves (MHWs) over a period of up to 7 days. The findings indicate that ML approaches can outperform traditional dynamical models, highlighting their potential for capturing complex non-linear relationships in oceanic data.

Future research should focus on refining these ML models by addressing limitations related to data averaging and incorporating higher-resolution datasets. Additionally, integrating physical laws into ML frameworks may improve the reliability of forecasts. Expanding the scope to include more oceanic variables could enhance the understanding of MHW drivers. The development of these forecasting tools is crucial for proactive aquaculture and ecosystem management, enabling stakeholders to receive timely warnings and mitigate potential ecological impacts.

Introduction

The introduction of the paper emphasizes the critical importance of accurately predicting sea surface temperature (SST) and marine heatwaves (MHWs), which are prolonged SST extremes lasting at least five days. These phenomena pose significant challenges to marine ecosystems and industries, necessitating effective forecasting methods to support adaptive management strategies. Despite advancements in dynamical ocean forecasting systems that enhance spatial resolution and data assimilation, predicting the oceanic and atmospheric patterns driving SST variability remains complex.

Recent interest in machine learning (ML) techniques offers promising alternatives to traditional dynamical models, providing computational efficiency and improved accuracy in forecasting SST and MHWs. The paper highlights various ML approaches, including shallow methods like linear regression and random forests, as well as deep learning models such as long short-term memory (LSTM) networks, which are particularly suited for time-series data. The Mediterranean Sea is chosen as the study area due to its high incidence of MHWs and its significance for aquaculture, which is predominantly concentrated in this region. The study aims to demonstrate the efficacy of ML methods in predicting SST and MHWs up to seven days in advance, comparing these predictions with those generated by the Copernicus Mediterranean Forecasting System (MedFS). The subsequent sections will detail the methodology, results, and conclusions of this research.

Results

In this section, the authors assess the predictive capabilities of machine learning (ML) techniques for sea surface temperature (SST) and marine heatwave (MHW) predictions, extending up to a lead time of 7 days. The evaluation employs the root mean square error (RMSE) as the performance metric for SST predictions, while the F1 score is utilized for assessing MHW predictions, as detailed in Section 2.4 on evaluation metrics. Additionally, the study examines the sensitivity of the ML models concerning the input variables within the testing dataset, providing insights into the robustness and reliability of the predictions.

Discussion

In this study, machine learning (ML) techniques are employed to predict sea surface temperature (SST) time series and marine heatwaves (MHWs) across 16 regions of the Mediterranean Sea. The research utilizes the European Space Agency’s Climate Change Initiative SST dataset, which provides satellite-derived SST data from 1981 to 2021, alongside atmospheric variables from the ECMWF ERA5 dataset. The methodology includes a mutual information analysis to identify relevant predictors for SST, followed by the application of three ML models: Long Short-Term Memory (LSTM) networks, one-dimensional Convolutional Neural Networks (CNN), and Random Forest (RForest). These models are trained on historical data and evaluated for their predictive accuracy using metrics such as root mean square error (RMSE) and F1 scores for MHW detection.

The results indicate that LSTM and RForest outperform CNN in predicting SST, particularly at shorter lead times, with RMSE values showing a consistent increase as the forecast lead time extends. Notably, LSTM exhibits the highest predictive skill in most regions, while RForest also demonstrates strong performance. The study further assesses the models’ abilities to predict MHW occurrences, revealing that all ML techniques generally underestimate SST peaks, with F1 scores above 0.5, indicating satisfactory prediction capabilities. Sensitivity analyses highlight the significant influence of SST itself on prediction accuracy, while incoming solar radiation and latent heat also play notable roles. Overall, the findings suggest that ML techniques can effectively forecast SST and MHWs in the Mediterranean, offering a valuable alternative to traditional dynamical models.