دراسة قائمة على التعلم الآلي حول الحساسية البيئية وعواملها المحركة في الأشكال الأرضية الكارستية في مقاطعة يانغشوو، غويلين
A machine learning-based study on ecological sensitivity and its driving factors in the karst landforms of Yangshuo County, Guilin

المجلة: Frontiers in Environmental Science، المجلد: 13
DOI: https://doi.org/10.3389/fenvs.2025.1742310
تاريخ النشر: 2026-01-12
المؤلف: Yu-tian Zhao وآخرون
الموضوع الرئيسي: أنظمة الكارست والهيدروجيولوجيا

نظرة عامة

تستكشف هذه الورقة البحثية الحساسية البيئية للمناظر الطبيعية الكارستية، مع التركيز بشكل خاص على مقاطعة يانغشوو في غويلين، الصين. تسلط الدراسة الضوء على هشاشة النظم البيئية الكارستية، التي تتميز بالتربة الضحلة والهياكل الهيدرولوجية المعقدة، مما يعقد فهم العمليات البيئية. تعتبر طرق التقييم التقليدية، مثل عملية التحليل الهرمي التحليلي (AHP) وتحليل المكونات الرئيسية (PCA)، غير كافية لالتقاط التفاعلات غير الخطية والعلاقات عالية الترتيب بين عوامل بيئية متعددة. لمعالجة هذه القيود، يقدم المؤلفون إطار تقييم جديد يجمع بين الخرائط الذاتية التنظيم (SOM)، ونماذج الغابات العشوائية (RF)، وSHapley Additive exPlanations (SHAP) لتقييم شامل للحساسية البيئية بناءً على 11 عاملًا، بما في ذلك الصخرية، والتصحر الصخري، وانحدار المنحدر.

تكشف النتائج عن خمسة مستويات متميزة من الحساسية البيئية في مقاطعة يانغشوو، حيث تعتبر مناطق الأراضي المزروعة من نوع الغطاء النباتي والوادي الأكثر حساسية. يحدد نموذج RF الصخرية، والتصحر الصخري، وانحدار المنحدر كالعوامل الرئيسية المحركة للحساسية البيئية، مما يبرز أهمية العوامل الأساسية الطبيعية على التأثيرات البشرية. تكشف تحليل SHAP عن تفاعلات غير خطية معقدة، مثل تضخيم مخاطر التصحر الصخري بواسطة المنحدرات الحادة والدور الوقائي للنباتات عند العتبات الحرجة. لا يتجاوز إطار SOM-RF-SHAP المطور القيود المفروضة على الطرق التقليدية فحسب، بل يوفر أيضًا منهجية قوية لقياس الحساسية البيئية في المناطق الكارستية. تؤكد النتائج على أهمية العوامل الجيولوجية والجيومورفولوجية في الحساسية البيئية، مما يوفر رؤى قيمة للحفاظ على البيئة والتخطيط المكاني في مقاطعة يانغشوو والمناظر الطبيعية المماثلة. تشمل اتجاهات البحث المستقبلية التحقق من صحة متعددة المقاييس وإدماج العوامل المتعلقة بالسياسات لتعزيز القدرات التنبؤية.

مقدمة

تناقش مقدمة الورقة أهمية المناظر الطبيعية الكارستية، التي تتشكل من خلال ذوبان وتآكل الصخور القابلة للذوبان مثل الحجر الجيري والدولوميت. تتميز هذه المناظر بخصائص سطحية وتحت سطحية فريدة، مثل الحفر والكهوف، وهي مهمة لدراسات المناخ القديم والحفاظ على التنوع البيولوجي. في الصين، تظهر المناطق الكارستية الواسعة، وخاصة في المقاطعات الغربية، مجموعة من الضعف البيئي بسبب خصائصها الجيولوجية، بما في ذلك التعرض العالي للصخور الأساسية والتربة الرقيقة. تسلط الورقة الضوء على الصراع المتزايد بين الأنشطة البشرية، مثل السياحة، والحاجة إلى الحفظ، مما يبرز الحاجة الملحة لتقييمات فعالة للحساسية البيئية في هذه البيئات الهشة.

تُنتقد الطرق التقليدية لتقييم الحساسية البيئية، مثل عملية التحليل الهرمي التحليلي (AHP) وتحليل المكونات الرئيسية (PCA)، بسبب افتراضاتها الخطية وقابليتها للتحيزات المعرفية. تقترح الدراسة إطارًا جديدًا يجمع بين خوارزمية الغابات العشوائية مع طريقة SHAP لتعزيز فهم التفاعلات والحساسيات البيئية في المناطق الكارستية. يسمح هذا الإطار “SOM-RF-SHAP” بالتجميع غير الخاضع للإشراف للبيانات البيئية، مما يوفر تحليلًا أكثر موضوعية للحساسية البيئية من خلال تحديد العوامل المحركة الرئيسية وتفاعلاتها دون تحيزات الطرق التقليدية. يهدف هذا النهج المتكامل إلى تعميق فهم الديناميات البيئية في المناظر الطبيعية الكارستية، ومعالجة الأسئلة الحرجة حول تمايز الأنماط، وهيمنة العوامل، وآليات التفاعل.

الطرق

تستخدم منهجية البحث الموضحة في هذه الدراسة إطار تقييم متكامل يجمع بين خريطة ذاتية التنظيم (SOM)، والغابات العشوائية، ونموذج SHAP للتفسير. تبدأ العملية بمعالجة البيانات الجغرافية متعددة المصادر، والتي تخضع بعد ذلك للتجميع غير الخاضع للإشراف باستخدام SOM لتحديد الأنماط المكانية المتعلقة بالحساسية البيئية. تعمل هذه المجموعات المحددة كعلامات مستهدفة لتدريب نموذج الغابات العشوائية، الذي يقيم الأهمية العالمية لعوامل القيادة المختلفة التي تؤثر على الحساسية البيئية.

بعد ذلك، يتم استخدام نموذج SHAP لتفسير التنبؤات التي قدمها نموذج الغابات العشوائية، مما يسمح بفحص مفصل للتأثيرات غير الخطية وآليات التفاعل لعوامل القيادة على كل من المقاييس المحلية والعالمية. يخلق هذا النهج المنهجي سلسلة تحليلية شاملة تنتقل من اكتشاف الأنماط المكانية إلى فهم آلي للعمليات البيئية الأساسية.

النتائج

استخدمت نتائج الدراسة خوارزمية K-Means لتحديد العدد الأمثل من المجموعات للحساسية البيئية في مقاطعة يانغشوو، حيث تم تحديد خمس فئات متميزة بناءً على معيار الكوع. استخدمت التحليل كل من خوارزميات خريطة ذاتية التنظيم (SOM) وK-Means، حيث تفوقت SOM باستمرار على K-Means عبر ثلاثة مقاييس تحقق داخلية: معامل الشكل، ومؤشر ديفيس-بولدين (DBI)، ومؤشر كالينسكي-هاراباز (CH). أظهرت التكوينات مع K = 5 أفضل DBI، مما يشير إلى توازن ملائم بين تماسك داخل المجموعة وفصل بين المجموعات. أكدت التصورات من خلال تحليل المكونات الرئيسية (PCA) الفصل المتميز لفئات الحساسية البيئية الخمس، مما يعزز من عقلانية حل الخمس مجموعات.

تكشف نتائج الدراسة أن الحساسية البيئية في مقاطعة يانغشوو تتأثر بشكل رئيسي بالعوامل الجيولوجية والجيومورفولوجية، بينما تلعب الأنشطة البشرية دورًا ثانويًا. تظهر الفئات الحساسية السائدة—الفئة الثالثة (حساسية نوع الغطاء النباتي) والفئة الرابعة (الأراضي المزروعة في الأودية الحساسة)—توزيعًا جغرافيًا واضحًا يربط بين الهشاشة الطبيعية والممارسات الزراعية. أبرز نموذج الغابات العشوائية التأثير الكبير للعوامل الأساسية الطبيعية، مثل الصخرية وانحدار المنحدر، على الحساسية البيئية، بينما كشفت تحليل SHAP عن مسارات تنظيمية محددة لكل فئة. يظهر الإطار الذي تم تطويره في هذه الدراسة وعدًا لتطبيقات أوسع، مما يشير إلى أن البحث المستقبلي يمكن أن يدمج مؤشرات إضافية لتعزيز التقييمات البيئية وإبلاغ الأهداف السياسية المتعلقة بالحياد الكربوني والأمن البيئي.

المناقشة

تركز الدراسة على مقاطعة يانغشوو، وهي منطقة تتميز بمناظرها الطبيعية الكارستية الفريدة وحساسيتها البيئية، التي تتأثر بشكل كبير بالسياحة وتدهور البيئة. تقع المنطقة في منطقة قوانغشي ذاتية الحكم في الصين، وتتميز بتضاريس متنوعة، بما في ذلك غابات قمم الكارست والأودية، وتتعرض لمناخ موسمي شبه استوائي. تسلط الأبحاث الضوء على الهشاشة البيئية للمنطقة، حيث يؤثر التصحر الصخري على 18.7% من الأرض ومعدل تآكل التربة مرتفع عند 3800 طن·كم⁻². تهدف الدراسة إلى تحليل التفاعل بين الحساسية البيئية والأنشطة البشرية، باستخدام مجموعة شاملة من 11 عاملًا مؤثرًا، بما في ذلك الصخرية، وانحدار المنحدر، وتغطية النباتات، لتقييم الحساسية البيئية للمنطقة.

تم الحصول على البيانات للتحليل بدقة ومعالجتها، باستخدام تقنيات متقدمة مثل الخرائط الذاتية التنظيم (SOM) لتجميع الحساسية البيئية وخوارزميات الغابات العشوائية لتحديد أهمية العوامل المختلفة. تكشف نتائج الدراسة أن العناصر الاجتماعية والاقتصادية، إلى جانب العوامل الطبيعية، تلعب دورًا حاسمًا في فهم الحساسية البيئية على مستوى المقاطعة. حقق نموذج الغابات العشوائية درجة عالية من الماكرو-F1 بلغت 0.9310، مما يشير إلى قدرة تنبؤية قوية. بالإضافة إلى ذلك، تم استخدام طريقة SHAP لتوضيح مساهمات العوامل الفردية وتفاعلاتها، مما يوفر رؤى حول الديناميات المعقدة التي تؤثر على الحساسية البيئية. تؤكد هذه الأبحاث على ضرورة وجود استراتيجيات حفظ مستهدفة تأخذ في الاعتبار الأبعاد البيئية والاجتماعية والاقتصادية في المناطق الكارستية مثل مقاطعة يانغشوو.

القيود

تقدم الدراسة حول تقييم الحساسية البيئية باستخدام طرق التعلم الآلي عدة قيود قد تؤثر على نتائجها. تم اشتقاق مصادر البيانات الرئيسية، بما في ذلك نوع التربة، وتوزيع الصخرية، وتغطية النباتات، من مجموعات بيانات عامة وصور استشعار عن بعد متوسطة الدقة، والتي قد لا تمثل بدقة الوحدات الجيومورفولوجية الدقيقة أو المناطق المتأثرة بالأنشطة البشرية قصيرة الأجل. من الجدير بالذكر أن العوامل الحرجة المحددة للنظم البيئية الكارستية، مثل كثافة الشقوق الكارستية والتوزيع المكاني للأنهار الجوفية، تم استبعادها من النمذجة بسبب تحديات الحصول على البيانات. قد تعيق هذه الإغفالات قدرة النموذج على وصف الديناميات البيئية للأنظمة الكارستية بشكل كامل، خاصة في المناطق المتأثرة بتدفقات المياه الجوفية.

بالإضافة إلى ذلك، بينما حسنت طرق الغابات العشوائية وSHAP عمق التفسير لمساهمات العوامل، فإنها تكشف بشكل أساسي عن الارتباطات الإحصائية بدلاً من العلاقات السببية المحددة. تستند نتائج الدراسة إلى بيانات من مقاطعة يانغشوو، مما يفتقر إلى التحقق عبر مقاييس مختلفة أو مناطق كارستية أوسع، مما يثير تساؤلات حول قابلية تطبيق النموذج وقابلية نقل المعلمات. علاوة على ذلك، فإن الطبيعة الثابتة لتقييم الحساسية لا تأخذ في الاعتبار التغيرات الزمنية أو العوامل الاجتماعية والاقتصادية، مما يحد من أهميتها في اتخاذ القرارات المتعلقة بالاستعادة البيئية والتخطيط المكاني. يجب أن تهدف الأبحاث المستقبلية إلى دمج بيانات عالية الدقة، ونمذجة السلاسل الزمنية، والمتغيرات المتعلقة بالحكم لتعزيز قوة وقابلية تطبيق تقييمات الحساسية البيئية.

Journal: Frontiers in Environmental Science, Volume: 13
DOI: https://doi.org/10.3389/fenvs.2025.1742310
Publication Date: 2026-01-12
Author(s): Yu-tian Zhao et al.
Primary Topic: Karst Systems and Hydrogeology

Overview

This research paper investigates the ecological sensitivity of karst landscapes, specifically focusing on Yangshuo County in Guilin, China. The study highlights the fragility of karst ecosystems, characterized by shallow soils and complex hydrological structures, which complicate the understanding of ecological processes. Traditional evaluation methods, such as Analytic Hierarchy Process (AHP) and Principal Component Analysis (PCA), are inadequate for capturing the non-linear interactions and high-order relationships among multiple ecological factors. To address these limitations, the authors introduce a novel assessment framework that integrates Self-Organizing Maps (SOM), Random Forest (RF) models, and SHapley Additive exPlanations (SHAP) for a comprehensive evaluation of ecological sensitivity based on 11 factors, including lithology, rocky desertification, and slope gradient.

The findings reveal five distinct levels of ecological sensitivity in Yangshuo County, with vegetation-type and valley cultivated land areas being the most sensitive. The RF model identifies lithology, rocky desertification, and slope gradient as the primary drivers of ecological sensitivity, emphasizing the significance of natural baseline factors over anthropogenic influences. SHAP analysis uncovers complex non-linear interactions, such as the amplification of rocky desertification risks by steep slopes and the protective role of vegetation at critical thresholds. The developed SOM-RF-SHAP framework not only overcomes the limitations of traditional methods but also provides a robust methodology for quantifying ecological sensitivity in karst regions. The results underscore the importance of geological and geomorphological factors in ecological sensitivity, offering valuable insights for conservation and spatial planning in Yangshuo County and similar landscapes. Future research directions include multi-scale validation and the incorporation of policy-related factors to enhance predictive capabilities.

Introduction

The introduction of the paper discusses the significance of karst landscapes, which are formed through the dissolution and erosion of soluble rocks like limestone and dolomite. These landscapes are characterized by unique surface and subsurface features, such as sinkholes and caves, and are important for paleoclimate studies and biodiversity conservation. In China, extensive karst regions, particularly in the western provinces, exhibit a range of ecological vulnerabilities due to their geological characteristics, including high bedrock exposure and thin soils. The paper highlights the increasing conflict between human activities, such as tourism, and the need for conservation, emphasizing the urgent need for effective ecological sensitivity assessments in these fragile environments.

Traditional methods for assessing ecological sensitivity, such as the Analytic Hierarchy Process (AHP) and Principal Component Analysis (PCA), are critiqued for their linear assumptions and susceptibility to cognitive biases. The study proposes a novel framework combining the Random Forest algorithm with the SHAP method to enhance the understanding of ecological interactions and sensitivities in karst areas. This “SOM-RF-SHAP” framework allows for unsupervised clustering of ecological data, providing a more objective analysis of ecological sensitivity by identifying key driving factors and their interactions without the biases of traditional methods. This integrated approach aims to deepen the understanding of ecological dynamics in karst landscapes, addressing critical questions about pattern differentiation, factor dominance, and interaction mechanisms.

Methods

The research methodology outlined in this study employs an integrated assessment framework that combines a Self-Organizing Map (SOM), Random Forest, and the SHAP interpretability model. The process begins with the preprocessing of multi-source geospatial data, which is then subjected to unsupervised clustering using SOM to identify spatial patterns related to ecological sensitivity. These identified clusters serve as target labels for training a Random Forest model, which assesses the global importance of various driving factors influencing ecological sensitivity.

Subsequently, the SHAP model is utilized to interpret the predictions made by the Random Forest, allowing for a detailed examination of the non-linear effects and interaction mechanisms of the driving factors at both local and global scales. This methodological approach effectively creates a comprehensive analytical chain that transitions from the discovery of spatial patterns to a mechanistic understanding of the underlying ecological processes.

Results

The results of the study employed the K-Means algorithm to determine the optimal number of clusters for ecological sensitivity in Yangshuo County, identifying five distinct classes based on the elbow criterion. The analysis utilized both Self-Organizing Map (SOM) and K-Means algorithms, with SOM consistently outperforming K-Means across three internal validation metrics: the Silhouette Coefficient, Davies-Bouldin Index (DBI), and Calinski-Harabasz Index (CH). The configuration with K = 5 yielded the best DBI, indicating a favorable balance between intra-cluster compactness and inter-cluster separation. Visualization through principal component analysis (PCA) confirmed the distinct separation of the five ecological sensitivity categories, reinforcing the rationality of the five-cluster solution.

The study’s findings reveal that ecological sensitivity in Yangshuo County is primarily influenced by geological and geomorphological factors, with human activities playing a secondary role. The dominant sensitivity classes—Class III (Vegetation Type Sensitive) and Class IV (Cultivated Land in River Valleys Sensitive)—demonstrate a clear geographical distribution that intertwines natural fragility with agricultural practices. The Random Forest model highlighted the significant impact of natural baseline factors, such as lithology and slope gradient, on ecological sensitivity, while SHAP analysis uncovered specific regulatory pathways for each class. The framework developed in this study shows promise for broader applications, suggesting future research could integrate additional indicators to enhance ecological assessments and inform policy objectives related to carbon neutrality and ecological security.

Discussion

The study focuses on Yangshuo County, a region characterized by its unique karst landscape and ecological sensitivity, which is significantly impacted by tourism and environmental degradation. The area, located in the Guangxi Zhuang Autonomous Region of China, features diverse topography, including karst peak forests and valleys, and experiences a mid-subtropical monsoon climate. The research highlights the ecological fragility of the region, with rocky desertification affecting 18.7% of the land and a high soil erosion rate of 3800 t·km⁻². The study aims to analyze the interaction between ecological sensitivity and human activities, utilizing a comprehensive set of 11 influencing factors, including lithology, slope gradient, and vegetation cover, to assess the ecological sensitivity of the region.

Data for the analysis was meticulously sourced and processed, employing advanced techniques such as Self-Organizing Maps (SOM) for clustering ecological sensitivity and Random Forest algorithms to quantify the importance of various factors. The study’s findings reveal that socio-economic elements, alongside natural factors, play a crucial role in understanding ecological sensitivity at the county level. The Random Forest model achieved a high macro-F1 score of 0.9310, indicating robust predictive capability. Additionally, the SHAP method was employed to elucidate the contributions of individual factors and their interactions, providing insights into the complex dynamics influencing ecological sensitivity. This research underscores the necessity for targeted conservation strategies that consider both ecological and socio-economic dimensions in karst regions like Yangshuo County.

Limitations

The study on ecological sensitivity assessment using machine learning methods presents several limitations that may affect its findings. Key data sources, including soil type, lithology distribution, and vegetation coverage, were derived from public datasets and medium-resolution remote sensing imagery, which may not accurately represent fine-scale geomorphic units or areas impacted by short-term anthropogenic activities. Notably, critical factors specific to karst ecosystems, such as karst fissure density and the spatial distribution of underground rivers, were excluded from the modeling due to data acquisition challenges. This omission could hinder the model’s ability to fully characterize the ecological dynamics of karst systems, particularly in regions influenced by underground water flows.

Additionally, while the Random Forest and SHAP methods improved the interpretative depth of factor contributions, they primarily reveal statistical associations rather than definitive causal relationships. The study’s findings are based on data from Yangshuo County, lacking validation across different scales or broader karst regions, which raises questions about the model’s applicability and parameter transferability. Furthermore, the static nature of the sensitivity assessment does not account for temporal changes or socio-economic factors, limiting its relevance for decision-making in ecological restoration and spatial planning. Future research should aim to incorporate higher-resolution data, time-series modeling, and governance-related variables to enhance the robustness and applicability of ecological sensitivity evaluations.