التعلم الآلي كأداة للتنبؤ بالتبخر المرجعي
Machine Learning as a Tool to Predict Reference Evapotranspiration

المجلة: Water Resources Management، المجلد: 40، العدد: 3
DOI: https://doi.org/10.1007/s11269-025-04460-8
تاريخ النشر: 2026-02-01
المؤلف: Safa Alkanjo وآخرون
الموضوع الرئيسي: علاقات المياه في النباتات وديناميات الكربون

نظرة عامة

تبحث هذه الدراسة في توقع التبخر والنتح المرجعي (ET) في محافظة سيارت التركية، وهي منطقة شبه جافة، باستخدام تقنيات التعلم الآلي المختلفة (آلة الدعم الشعاعي، XgBoost، الجيران الأقرب، الغابة العشوائية) ونماذج الانحدار الإحصائي (الرباعيات، المربعات الصغرى الجزئية، LASSO، Ridge، Elastic Net، غير المعلمية، الخطية). تضمنت النماذج متغيرات المناخ مثل درجة الحرارة، الرطوبة، سرعة الرياح، والإشعاع الشمسي. أظهرت نموذج الغابة العشوائية أعلى أداء مع $R^2$ قدره 0.948، بينما كان أداء XgBoost هو الأضعف عند $R^2$ قدره 0.776. من بين طرق الانحدار، حقق الانحدار غير المعلمي أيضًا $R^2$ قدره 0.948، بينما حقق نموذج تصميم التجارب (DoE) أفضل دقة عامة ($R^2 = 0.987$)، مع تحديد متوسط درجة الحرارة كأهم عامل يؤثر على ET.

تؤكد النتائج على الدور الحاسم لدرجة الحرارة في ديناميات ET، خاصة في سياق تغير المناخ، حيث يمكن أن تؤدي درجات الحرارة المرتفعة إلى تفاقم ندرة المياه في المناطق الجافة. تسلط الدراسة الضوء على العلاقات المعقدة بين الضغط الجوي، الغيوم، وET، مما يشير إلى أن هذه العوامل حساسة للتغيرات المناخية. تدعو النتائج إلى دمج العلوم الجوية، الهيدرولوجية، والزراعية لتعزيز إدارة موارد المياه والاستدامة، مع التأكيد على الحاجة إلى استراتيجيات تكيفية للتخفيف من آثار تغير المناخ على توفر المياه والاستقرار الاجتماعي والاقتصادي.

مقدمة

تسلط المقدمة الضوء على الدور الحاسم للمياه في دعم الحياة ودعم التنمية الاقتصادية، مع التأكيد على أهمية إدارة موارد المياه بشكل فعال. يُعرف التبخر والنتح (ET) كعنصر رئيسي في الدورة الهيدرولوجية بأنه نقل بخار الماء من سطح الأرض إلى الغلاف الجوي، ويتأثر بعدة عوامل مناخية. شملت التطورات الأخيرة في نمذجة ET أساليب قائمة على الفيزياء، مثل معادلة Penman-Monteith (PM)، وتقنيات التعلم الآلي مثل آلات الدعم الشعاعي (SVM) والغابة العشوائية (RF)، التي أظهرت وعدًا في تقديم توقعات دقيقة حتى مع بيانات محدودة.

تهدف الدراسة المقدمة إلى تطوير إطار شامل لتوقع ET المرجعي الشهري في محافظة سيارت، تركيا، من خلال دمج خوارزميات التعلم الآلي المتقدمة (SVM، RF، XGBoost، KNN) مع تقنيات النمذجة الإحصائية، بما في ذلك الانحدار المتعدد وتصميم التجارب (DoE). باستخدام بيانات هيدرولوجية ومناخية طويلة الأجل من 1980 إلى 2023، تسعى الدراسة إلى توضيح التفاعلات المعقدة بين ET ومتغيرات جوية مختلفة، مما يعزز فهم الديناميات الهيدرولوجية في سياق تغير المناخ. من المتوقع أن يحسن هذا النهج المبتكر من دقة التوقعات ويساهم بشكل كبير في استراتيجيات إدارة موارد المياه.

الطرق

توضح قسم “المواد والطرق” تصميم التجربة والإجراءات المستخدمة في الدراسة. يتفصيل المواد المحددة المستخدمة، بما في ذلك أي مواد كيميائية، معدات، وعينات بيولوجية، مما يضمن إمكانية تكرار التجارب. تشمل المنهجية البروتوكولات لجمع البيانات، بما في ذلك أي تحليلات إحصائية تم إجراؤها لتفسير النتائج.

بالإضافة إلى ذلك، قد يصف القسم الظروف التجريبية، مثل درجة الحرارة، المدة، وأي ضوابط تم تنفيذها للتحقق من النتائج. بشكل عام، يخدم هذا القسم لتقديم نظرة شاملة على التقنيات والعمليات التي تدعم البحث، مما يسمح بالتقييم النقدي والتكرار من قبل باحثين آخرين في هذا المجال.

النتائج

أسفرت التحليلات الانحدارية التي أجريت في هذه الدراسة عن نتائج مهمة تتعلق بالعلاقات بين المتغيرات المستقلة والتابعة. أظهر النموذج توافقًا قويًا، كما يتضح من قيمة R-squared العالية، مما يشير إلى أن نسبة كبيرة من التباين في المتغير التابع يمكن تفسيرها من خلال المتنبئين المدرجين في النموذج.

كانت المعاملات الرئيسية ذات دلالة إحصائية، مع قيم p أقل من 0.05، مما يشير إلى أن المتغيرات المستقلة المقابلة لها تأثير معنوي على المتغير التابع. بالإضافة إلى ذلك، كشفت التحليلات عن علاقات إيجابية وسلبية، مما يبرز تعقيد التفاعلات بين المتغيرات. بشكل عام، تؤكد النتائج على أهمية المتنبئين المحددين في فهم الديناميات الأساسية للظاهرة المدروسة.

المناقشة

في دراسة التبخر والنتح (ET) في محافظة سيارت، تركيا، تم استخدام نماذج متعددة من التعلم الآلي (ML) للتنبؤ بـ ET باستخدام مجموعة بيانات شاملة من المتغيرات المناخية من 1980 إلى 2023. كشفت التحليلات أن متغيرات درجة الحرارة، وخاصة درجة الحرارة الدنيا (Tmin) ودرجة الحرارة المتوسطة (Tav)، أظهرت ارتباطات إيجابية قوية مع ET، بينما أظهرت قياسات الرطوبة النسبية ارتباطات سلبية. أظهر نموذج الغابة العشوائية (RF) أعلى دقة تنبؤية، مع R² قدره 0.948، مما يشير إلى أنه التقط ما يقرب من 95% من التباين في ET. كما أدت نماذج أخرى، بما في ذلك آلة الدعم الشعاعي (SVM) وExtreme Gradient Boosting (XgBoost)، أداءً جيدًا، مع قيم R² قدرها 0.934 و0.78، على التوالي، على الرغم من أنها أظهرت أخطاء تنبؤية أعلى مقارنة بـ RF.

استخدمت الدراسة أيضًا نهج تصميم التجارب (DoE)، مما كشف أن النماذج التي تستخدم جميع المعلمات تفوقت بشكل كبير على تلك التي تستخدم معلمات فردية، محققة R² قدره 0.987. سلطت التحليلات الضوء على الدور الحاسم لدرجة الحرارة وسرعة الرياح في التأثير على ET، مع كون Tav هو المتغير الأكثر تأثيرًا. بالإضافة إلى ذلك، أظهرت نماذج مثل Elastic Net والانحدار Ridge قوة تفسيرية قوية، مؤكدة على أهمية درجة الحرارة وهطول الأمطار في ديناميات ET. بشكل عام، تؤكد النتائج على فعالية تقنيات ML في التنبؤ بدقة بـ ET والأثر الكبير للعوامل المناخية في منطقة سيارت.

Journal: Water Resources Management, Volume: 40, Issue: 3
DOI: https://doi.org/10.1007/s11269-025-04460-8
Publication Date: 2026-02-01
Author(s): Safa Alkanjo et al.
Primary Topic: Plant Water Relations and Carbon Dynamics

Overview

This research investigates the prediction of reference evapotranspiration (ET) in Türkiye’s Siirt province, a semi-arid region, utilizing various machine learning techniques (Support Vector Machine, XgBoost, K-Nearest Neighbors, Random Forest) and statistical regression models (Quartile, Partial Least Squares, LASSO, Ridge, Elastic Net, NonParametric, Linear). The models incorporated climate variables such as temperature, humidity, wind speed, and solar radiation. The Random Forest model exhibited the highest performance with an $R^2$ of 0.948, while XgBoost performed the weakest at $R^2$ of 0.776. Among regression methods, NonParametric regression also achieved an $R^2$ of 0.948, while the Design of Experiments (DoE) model yielded the best overall accuracy ($R^2 = 0.987$), identifying average temperature as the most significant factor influencing ET.

The findings underscore the critical role of temperature in ET dynamics, particularly in the context of climate change, where rising temperatures could exacerbate water scarcity in arid regions. The study highlights the intricate relationships between atmospheric pressure, cloudiness, and ET, suggesting that these factors are sensitive to climatic changes. The results advocate for the integration of meteorological, hydrological, and agricultural sciences to enhance water resource management and sustainability, emphasizing the need for adaptive strategies to mitigate the impacts of climate change on water availability and socio-economic stability.

Introduction

The introduction highlights the critical role of water in sustaining life and supporting economic development, emphasizing the importance of effective water resource management. Evapotranspiration (ET), a key component of the hydrological cycle, is defined as the transfer of water vapor from land surfaces to the atmosphere, influenced by various climatic factors. Recent advancements in modeling ET have included physics-based approaches, such as the Penman-Monteith (PM) equation, and machine learning techniques like Support Vector Machines (SVM) and Random Forest (RF), which have shown promise in providing accurate predictions even with limited data.

The research presented aims to develop a comprehensive framework for predicting monthly reference ET in Siirt province, Türkiye, by integrating advanced machine learning algorithms (SVM, RF, XGBoost, KNN) with statistical modeling techniques, including multiple regression and Design of Experiments (DoE). Utilizing long-term hydro-meteorological data from 1980 to 2023, the study seeks to elucidate the complex interactions between ET and various atmospheric variables, thereby enhancing the understanding of hydrological dynamics in the context of climate change. This innovative approach is expected to improve predictive accuracy and contribute significantly to water resource management strategies.

Methods

The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the specific materials used, including any reagents, equipment, and biological samples, ensuring reproducibility of the experiments. The methodology encompasses the protocols for data collection, including any statistical analyses performed to interpret the results.

Additionally, the section may describe the experimental conditions, such as temperature, duration, and any controls implemented to validate the findings. Overall, this section serves to provide a comprehensive overview of the techniques and processes that underpin the research, allowing for critical evaluation and replication by other researchers in the field.

Results

The regression analysis conducted in this study yielded significant findings regarding the relationships between the independent and dependent variables. The model demonstrated a strong fit, as indicated by a high R-squared value, suggesting that a substantial proportion of the variance in the dependent variable can be explained by the predictors included in the model.

Key coefficients were statistically significant, with p-values less than 0.05, indicating that the corresponding independent variables have a meaningful impact on the dependent variable. Additionally, the analysis revealed both positive and negative relationships, highlighting the complexity of the interactions among the variables. Overall, the results underscore the importance of the identified predictors in understanding the underlying dynamics of the studied phenomenon.

Discussion

In the study of evapotranspiration (ET) in Siirt province, Türkiye, various machine learning (ML) models were employed to predict ET using a comprehensive dataset of meteorological variables from 1980 to 2023. The analysis revealed that temperature variables, particularly minimum temperature (Tmin) and average temperature (Tav), exhibited strong positive correlations with ET, while relative humidity measures showed negative correlations. The Random Forest (RF) model demonstrated the highest predictive accuracy, with an R² of 0.948, indicating it captured nearly 95% of the variance in ET. Other models, including Support Vector Machine (SVM) and Extreme Gradient Boosting (XgBoost), also performed well, with R² values of 0.934 and 0.78, respectively, although they exhibited higher prediction errors compared to RF.

The study further employed a Design of Experiment (DoE) approach, revealing that models utilizing all parameters significantly outperformed those using single parameters, achieving an R² of 0.987. The analysis highlighted the critical role of temperature and wind speed in influencing ET, with Tav being the most influential variable. Additionally, models such as Elastic Net and Ridge Regression showed strong explanatory power, confirming the importance of temperature and precipitation in ET dynamics. Overall, the findings underscore the effectiveness of ML techniques in accurately predicting ET and the significant impact of climatic factors in the Siirt region.