نهج جديد لنمذجة الاحتمالية المكانية للزلازل من خلال دمج إجهاد الجيوديسيا في الذكاء الاصطناعي القابل للتفسير (XAI)
A novel approach for earthquake spatial probability modeling by integration of geodetic strain into explainable artificial intelligence (XAI)

المجلة: Stochastic Environmental Research and Risk Assessment، المجلد: 40، العدد: 1
DOI: https://doi.org/10.1007/s00477-025-03145-3
تاريخ النشر: 2026-01-01
المؤلف: Süleyman Sefa BİLGİLİOĞLU وآخرون
الموضوع الرئيسي: دراسات الزلازل والتكتونيات

نظرة عامة

تقدم هذه القسم نظرة عامة على الظواهر الزلزالية المرتبطة بحركات الصفائح التكتونية، مع تسليط الضوء على الإفراج المفاجئ عن الطاقة الذي يولد الموجات الزلزالية ويؤدي إلى اهتزاز الأرض بشكل كبير. تُعتبر الزلازل كوارث متعددة الأبعاد لها عواقب اقتصادية واجتماعية وبنية تحتية بعيدة المدى. ومن الجدير بالذكر أنه بينما تكون معظم الأحداث الزلزالية صغيرة، يمكن أن تؤدي الزلازل عالية الشدة النادرة إلى خسائر اقتصادية واجتماعية كبيرة، بما في ذلك انخفاض الناتج المحلي الإجمالي (GDP) واضطرابات في البنية التحتية الأساسية مثل أنظمة الطاقة والنقل والرعاية الصحية.

في الختام، يقدم البحث إطارًا منهجيًا جديدًا لنمذجة احتمالية الزلازل المكاني في تركيا، باستخدام تقنيات الذكاء الاصطناعي القابلة للتفسير. يدمج البحث بيانات الزلازل التكتونية، والمورفومترية، والجيوفيزيائية المعالجة من خلال أربعة نماذج تعلم آلي قائمة على الأشجار. أظهرت التقييمات المقارنة لأداء النموذج أن نموذج الغابة العشوائية (RF) تفوق على الآخرين من حيث درجة F1، والدقة العامة، واتساق القرار، مما يوفر كل من التحقق العددي والرؤى الجيولوجية التي تعزز استراتيجيات إدارة مخاطر الزلازل.

مقدمة

تسلط مقدمة هذه الورقة البحثية الضوء على الحاجة الملحة لتحسين نمذجة احتمالية الزلازل المكاني، لا سيما في سياق تركيا، التي تقع على صفيحة الأناضول النشطة زلزاليًا. يؤكد المؤلفون أن طرق تقييم المخاطر الزلزالية التقليدية، مثل تحليل المخاطر الزلزالية الحتمية (DSHA) وتحليل المخاطر الزلزالية الاحتمالية (PSHA)، لها قيود كبيرة بسبب اعتمادها على البيانات التاريخية والمعايير الجيولوجية الثابتة. تفشل هذه الطرق في حساب العمليات الديناميكية بشكل كافٍ مثل إجهاد الجيوديسيا، الذي يعكس تراكم الطاقة في قشرة الأرض وهو أمر حاسم لفهم إمكانية التنبؤ بالزلازل.

تقترح هذه الدراسة نهجًا جديدًا يدمج بيانات إجهاد الجيوديسيا المستمدة من أنظمة الملاحة عبر الأقمار الصناعية العالمية (GNSS) مع تقنيات التعلم الآلي المتقدمة، وخاصة النماذج القائمة على الأشجار مثل الغابة العشوائية (RF) وتعزيز التدرج المتطرف (XGBoost). تهدف الدراسة إلى سد الفجوات الموجودة في الأدبيات من خلال كونها الأولى التي تدمج إجهاد الجيوديسيا وكثافة الخطوط في نموذج شامل على المستوى الوطني لاحتمالية الزلازل في تركيا. تتضمن المنهجية عملية متعددة المراحل تدمج أحد عشر متغيرًا مكانيًا وتستخدم اختبار مك نمار للتحقق الإحصائي، مما يوفر في النهاية رؤى حول نقاط القوة والقيود لمختلف خوارزميات التعلم الآلي. من المتوقع أن تعزز النتائج استراتيجيات إدارة مخاطر الزلازل في تركيا وتقدم إطارًا قابلًا للنقل لمناطق تكتونية مماثلة.

طرق

في هذه الدراسة، تم تطوير نهج قائم على التعلم الآلي القابل للتفسير لنمذجة احتمالية الزلازل المكاني، مع التركيز على صفيحة الأناضول النشطة تكتونيًا. تضمنت المنهجية توحيد 11 متغيرًا مكانيًا من مجالات موضوعية متنوعة إلى تنسيق راستر، والذي شمل عوامل مثل التشوه التكتوني، والطبقات الجيولوجية، والخصائص المورفومترية. أكدت الدراسة بشكل خاص على منطقة صدع شمال الأناضول (NAFZ) ومنطقة صدع شرق الأناضول (EAFZ)، وكلاهما مصدران حاسمان للنشاط الزلزالي. يتمتع NAFZ، وهو صدع كبير ذو انزلاق جانبي يمين، بتاريخ من الزلازل المدمرة، بينما أظهرت EAFZ مؤخرًا إمكاناتها الزلزالية من خلال زلازل كهرمان مرعش المدمرة.

لإنشاء نموذج شامل لاحتمالية الزلازل، دمج الباحثون معايير مكانية تمت معالجتها ضمن نظام مرجعي مشترك. تم اشتقاق المتغيرات الرئيسية من كتالوجات الزلازل، وخرائط المخاطر الزلزالية، ونماذج الارتفاع الرقمية، مع تقليل التعدد الخطي بين المتغيرات باستخدام معاملات الارتباط بيرسون والتشخيصات. تم إجراء التصنيف باستخدام أربعة نماذج تعلم آلي قائمة على الأشجار – الغابة العشوائية، الأشجار الإضافية، XGBoost، وLightGBM – تم تحسينها من خلال خوارزمية Optuna. تم تقييم أداء النموذج باستخدام مقاييس متنوعة، وتم تحليل أفضل نموذج باستخدام طريقة SHAP لتفسير مساهمات الميزات. كانت النتيجة النهائية هي خريطة احتمالية الزلازل المكاني (ESPM)، التي توفر تقديرًا متعدد الأبعاد لاحتمالات الزلازل عبر منطقة الدراسة.

نتائج

أشارت نتائج تحليل التعدد الخطي إلى عدم وجود تعدد خطي كبير بين الميزات المكانية المستخدمة في عملية النمذجة، كما يتضح من قيم عامل التضخم التبايني (VIF) التي تقل عن 5 وقيم التسامح (TOL) التي تتجاوز 0.1 لجميع المتغيرات. سمح ذلك بالاحتفاظ بجميع الميزات في النمذجة. بالإضافة إلى ذلك، كشفت معاملات الارتباط بيرسون عن علاقات ضعيفة إلى متوسطة بين الميزات، مما يدعم غياب التكرار العالي. تم تقييم أداء تصنيف النماذج باستخدام مقاييس متنوعة، بما في ذلك الدقة، والدقة، والاسترجاع، ودرجة F1، وكابا كوهين، وROC-AUC. حقق نموذج الغابة العشوائية (RF) أعلى دقة (0.911) ودقة (0.913)، بينما تبعته نموذج الأشجار الإضافية بدقة 0.900. في المقابل، أظهرت XGBoost وLightGBM مقاييس أداء أقل، لا سيما من حيث الإيجابيات الكاذبة والسلبيات الكاذبة.

كشف التحقق الإحصائي باستخدام اختبار مك نمار عن فرق كبير في أداء التصنيف بين نماذج RF وXGBoost (p = 0.0116)، مما يشير إلى اختلافات منهجية في توقعاتهما. لم تُظهر المقارنات الأخرى للنماذج اختلافات ذات دلالة إحصائية، مما يشير إلى سلوكيات قرار مماثلة بينها. سلط التحليل الضوء على قدرة RF الفائقة على تقليل السلبيات الكاذبة، مما يضمن تحديد المناطق المعرضة للزلازل بدقة. علاوة على ذلك، أكد تحليل SHAP أن نموذج RF تعلم بشكل فعال هيكل قرار متسق جسديًا، مع تحديد تراكم الإجهاد كمتنبئ حاسم لاحتمالية الزلازل. لعبت متغيرات أخرى، مثل القرب من حدود الصفائح وكثافة الخطوط، أدوارًا داعمة، بينما كان للطبقات الجيولوجية تأثير ضئيل على التنبؤات. بشكل عام، تؤكد هذه النتائج على قوة نموذج RF في نمذجة احتمالية الزلازل، مما يبرز أهمية الإجهاد كمؤشر رئيسي في هذا السياق.

مناقشة

ت outlines قسم المناقشة في الورقة البحثية الخصائص الزلزالية التكتونية لصفيحة الأناضول، مع التركيز على تفاعلاتها المعقدة مع الصفائح التكتونية المجاورة، والتي تسهم في النشاط الزلزالي الكبير في تركيا. تشهد المنطقة حركة نحو الغرب-الجنوب الغربي تبلغ حوالي 25-30 مم/سنة بسبب الانغماس الشمالي لصفيحة إفريقيا والقوى الضاغطة من صفيحة العرب. أدت هذه البيئة الديناميكية إلى تشكيل أنظمة صدع حاسمة، لا سيما في غرب الأناضول، حيث تحدث العديد من الزلازل المتوسطة، إلى جانب أحداث مدمرة ذات مقاييس أكبر من 6. في المقابل، تستضيف وسط الأناضول، رغم أنها أكثر هدوءًا بشكل عام، مجموعة متنوعة من الصدوع المتأثرة بالتكتونيات التمددية والضغط.

تستخدم الدراسة نهجًا متعدد المعايير لنمذجة احتمالية الزلازل، مستفيدة من 11 متغيرًا مكانيًا مستمدًا من مجالات موضوعية متنوعة. تشمل هذه كثافة مراكز الزلازل، وكثافة المقاييس، والقرب من الصدوع، وإجهاد الجيوديسيا، من بين أمور أخرى. تتكون مجموعة البيانات من تمثيل متوازن لحدوث الزلازل وعدم حدوثها، مما يسهل تدريب وتقييم نماذج التعلم الآلي بشكل قوي. تم استخدام نموذج الغابة العشوائية (RF)، الذي أظهر أعلى أداء تصنيفي، لإنشاء خريطة احتمالية الزلازل المكاني (ESPM) تشير إلى احتمالية الزلازل ذات مقاييس اللحظة (Mw) ≥ 4.0 عبر تركيا. توفر ESPM درجات احتمالية مستمرة، مما يسمح بفهم دقيق للمخاطر الزلزالية عبر المنطقة، مع تمثيلات بصرية تشير إلى مستويات متفاوتة من احتمالية الزلازل.

القيود

يقدم نموذج احتمالية الزلازل المكاني المقدم في هذه الدراسة تقييمًا شاملاً لمخاطر الزلازل عبر تركيا. على الرغم من قابليته الجغرافية الواسعة، قد يحد نطاق النموذج الوطني من دقته في التقاط التغيرات الزلزالية المحلية. قد لا يتم حساب عوامل مثل التباين الجيولوجي، والبنية التحتية الحضرية، والتاريخ الزلزالي، التي يمكن أن تؤثر بشكل كبير على احتمالات الزلازل، بشكل كامل في نموذج عام.

يجب أن تركز الأبحاث المستقبلية على تحسين النموذج من خلال دمج بيانات عالية الدقة وعوامل محلية لتعزيز دقته التنبؤية. بالإضافة إلى ذلك، يمكن أن يؤدي دمج المراقبة الزلزالية في الوقت الحقيقي وتقنيات التعلم الآلي المتقدمة إلى تحسين استجابة النموذج للأنماط الزلزالية الناشئة، مما يؤدي في النهاية إلى استراتيجيات أكثر فعالية للتخفيف من المخاطر.

Journal: Stochastic Environmental Research and Risk Assessment, Volume: 40, Issue: 1
DOI: https://doi.org/10.1007/s00477-025-03145-3
Publication Date: 2026-01-01
Author(s): Süleyman Sefa BİLGİLİOĞLU et al.
Primary Topic: earthquake and tectonic studies

Overview

The section provides an overview of the seismic phenomena associated with tectonic plate movements, highlighting the abrupt release of energy that generates seismic waves and results in significant ground shaking. Earthquakes are characterized as multidimensional disasters with far-reaching economic, social, and infrastructural repercussions. Notably, while most seismic events are minor, infrequent high-magnitude earthquakes can lead to substantial socio-economic losses, including declines in gross domestic product (GDP) and disruptions to essential infrastructure such as energy, transportation, and healthcare systems.

In the conclusion, the study introduces a novel methodological framework for spatial earthquake probability modeling in Türkiye, utilizing explainable artificial intelligence techniques. The research integrates sismotectonic, morphometric, and geodetic data processed through four distinct tree-based machine learning models. Comparative evaluations of model performance revealed that the Random Forest (RF) model outperformed others in terms of F1-score, overall accuracy, and decision consistency, thereby providing both numerical validation and geoscientific insights that enhance earthquake risk management strategies.

Introduction

The introduction of this research paper highlights the critical need for improved earthquake spatial probability modeling, particularly in the context of Türkiye, which is situated on the seismically active Anatolian Plate. The authors emphasize that traditional seismic hazard assessment methods, such as Deterministic Seismic Hazard Analysis (DSHA) and Probabilistic Seismic Hazard Analysis (PSHA), have significant limitations due to their reliance on historical data and static geological parameters. These methods fail to adequately account for dynamic processes like geodetic strain, which reflects energy accumulation in the Earth’s crust and is crucial for understanding earthquake predictability.

This study proposes a novel approach that integrates geodetic strain data derived from Global Navigation Satellite Systems (GNSS) with advanced machine learning techniques, specifically tree-based models such as Random Forest (RF) and Extreme Gradient Boosting (XGBoost). The research aims to fill existing gaps in the literature by being the first to incorporate geodetic strain and lineament density into a comprehensive national-level earthquake probability model for Türkiye. The methodology involves a multi-stage process that integrates eleven spatial variables and employs the McNemar test for statistical validation, ultimately providing insights into the strengths and limitations of various machine learning algorithms. The findings are expected to enhance earthquake risk management strategies in Türkiye and offer a transferable framework for similar tectonic regions.

Methods

In this study, an explainable machine learning (ML)-based approach was developed for spatial earthquake probability modeling, focusing on the tectonically active Anatolian Plate. The methodology involved standardizing 11 spatial variables from various thematic domains into raster format, which included factors such as tectonic deformation, lithology, and morphometric characteristics. The study particularly emphasized the North Anatolian Fault Zone (NAFZ) and the East Anatolian Fault Zone (EAFZ), both of which are critical sources of seismic activity. The NAFZ, a significant right-lateral strike-slip fault, has a history of destructive earthquakes, while the EAFZ has recently demonstrated its seismic potential through the devastating Kahramanmaraş earthquake doublets.

To create a comprehensive earthquake probability model, the researchers integrated spatial criteria processed within a common reference system. Key variables were derived from earthquake catalogs, seismic hazard maps, and digital elevation models, with multicollinearity among variables minimized using Pearson correlation coefficients and diagnostics. The classification was performed using four tree-based ML models—Random Forest, Extra Trees, XGBoost, and LightGBM—optimized through the Optuna algorithm. Model performance was assessed using various metrics, and the best-performing model was analyzed using the SHAP method to interpret feature contributions. The final output was an Earthquake Spatial Probability Map (ESPM), which provides a multidimensional estimation of earthquake probabilities across the study area.

Results

The results of the multicollinearity analysis indicated no substantial multicollinearity among the spatial features used in the modeling process, as evidenced by Variance Inflation Factor (VIF) values below 5 and Tolerance (TOL) values exceeding 0.1 for all variables. This allowed for the retention of all features in the modeling. Additionally, Pearson’s correlation coefficients revealed weak to moderate relationships among the features, further supporting the absence of high redundancy. The models’ classification performance was evaluated using various metrics, including accuracy, precision, recall, F1-score, Cohen’s Kappa, and ROC-AUC. The Random Forest (RF) model achieved the highest accuracy (0.911) and precision (0.913), while the Extra Trees model closely followed with an accuracy of 0.900. In contrast, XGBoost and LightGBM exhibited lower performance metrics, particularly in terms of false positives and false negatives.

Statistical validation using the McNemar test revealed a significant difference in classification performance between the RF and XGBoost models (p = 0.0116), indicating systematic discrepancies in their predictions. Other model comparisons did not show statistically significant differences, suggesting similar decision behaviors among them. The analysis highlighted RF’s superior ability to minimize false negatives, ensuring that earthquake-prone areas were accurately identified. Furthermore, SHAP analysis confirmed that the RF model effectively learned a physically consistent decision structure, with strain accumulation identified as a critical predictor of earthquake probability. Other variables, such as proximity to plate boundaries and lineament density, played supportive roles, while lithology had minimal impact on predictions. Overall, these findings underscore the robustness of the RF model in earthquake probability modeling, emphasizing the importance of strain as a key indicator in this context.

Discussion

The discussion section of the research paper outlines the seismotectonic characteristics of the Anatolian Plate, emphasizing its complex interactions with neighboring tectonic plates, which contribute to significant seismic activity in Türkiye. The region experiences a west-southwestward motion of approximately 25-30 mm/year due to the northward subduction of the African Plate and compressional forces from the Arabian Plate. This dynamic environment has led to the formation of critical fault systems, particularly in Western Anatolia, where numerous moderate earthquakes occur, alongside destructive events with magnitudes greater than 6. In contrast, Central Anatolia, while generally quieter, still hosts various faults influenced by extensional and compressional tectonics.

The study employs a multi-criteria approach for earthquake probability modeling, utilizing 11 spatial variables derived from diverse thematic domains. These include epicenter density, magnitude density, proximity to faults, and geodetic strain, among others. The dataset comprises a balanced representation of earthquake occurrences and non-occurrences, facilitating robust machine learning model training and evaluation. The Random Forest (RF) model, which demonstrated the highest classification performance, was used to generate an Earthquake Spatial Probability Map (ESPM) indicating the likelihood of earthquakes with moment magnitudes (Mw) ≥ 4.0 across Türkiye. The ESPM provides continuous probability scores, allowing for a nuanced understanding of seismic risk across the region, with visual representations indicating varying levels of earthquake likelihood.

Limitations

The spatial earthquake probability model presented in this study offers a comprehensive assessment of seismic risk across Türkiye. Despite its broad geographic applicability, the model’s national scale may limit its precision in capturing localized seismic variations. Factors such as geological heterogeneity, urban infrastructure, and historical seismicity, which can significantly influence earthquake probabilities, may not be fully accounted for in a generalized model.

Future research should focus on refining the model by incorporating high-resolution data and localized factors to enhance its predictive accuracy. Additionally, integrating real-time seismic monitoring and advanced machine learning techniques could improve the model’s responsiveness to emerging seismic patterns, ultimately leading to more effective risk mitigation strategies.