DOI: https://doi.org/10.1038/s41598-025-90906-3
PMID: https://pubmed.ncbi.nlm.nih.gov/39979476
تاريخ النشر: 2025-02-20
المؤلف: Zhou Jia وآخرون
الموضوع الرئيسي: الاستشعار عن بعد وتطبيقات LiDAR
نظرة عامة
تتناول هذه الدراسة الحاجة الملحة لتقديرات دقيقة للكتلة الحيوية فوق الأرض (AGB) في نظم الغابات البيئية، وبشكل خاص في شينجيانغ، حيث تفتقر خرائط توزيع AGB على مستوى المقاطعة حالياً. تركز الدراسة على أربعة أنواع رئيسية من الغابات – غابة الإبر الخضراء الدائمة (ENF)، غابة الإبر المتساقطة (DNF)، غابة الأوراق العريضة المتساقطة (DBF)، والغابة المختلطة (MF) – استخدمت البحث بيانات طبوغرافية ومناخية إلى جانب صور الأقمار الصناعية من لاندسات وMODIS. تم استخدام خوارزمية بوروتا لاختيار الميزات، والتي أبلغت عن بناء نماذج التعلم الآلي، بما في ذلك آلة الدعم الناقل (SVM)، وتعزيز التدرج المتطرف (XGBoost)، والغابة العشوائية (RF)، لتقدير AGB. كشفت النتائج أن المناخ والعوامل الطبوغرافية والنسيج أثرت بشكل كبير على دقة النموذج، حيث حقق نموذج RF أعلى مقاييس الأداء (R² > 0.65، RMSE بين 24.42 و41.75 Mg/hm²، وMAE بين 30.59 و60.46 Mg/hm²).
أشارت التوزيعات الجغرافية للكتلة الحيوية للغابات إلى أن المناطق ذات قيم AGB العالية كانت تقع بشكل أساسي في المناطق الجبلية، مثل جبال تيانشان وألتاي وجبال كونلون، بالإضافة إلى وادي إيلي وحوض نهر تاريم، مما يبرز التباين المكاني الكبير. تستنتج الدراسة أن دمج الميزات المناخية والطبوغرافية، إلى جانب عوامل النسيج، يعزز نماذج تقدير AGB. توفر النماذج المطورة إطاراً قوياً لتقدير AGB للغابات على نطاق واسع في المناطق الجافة، مما يساهم في تقديم رؤى قيمة حول دور الغابات في شينجيانغ ضمن دورة الكربون العالمية ويقدم أساساً لتطبيقات الاستشعار عن بعد المستقبلية في تقييم الكتلة الحيوية للغابات.
الطرق
في هذا القسم، يصف المؤلفون منهجيتهم لاختيار المتغيرات باستخدام خوارزمية بوروتا، المصممة لتعزيز دقة النموذج من خلال تحديد الميزات الأكثر صلة من مجموعة أكبر من المتغيرات المرشحة. تعمل طريقة بوروتا عن طريق إنشاء متغيرات ظل لكل متغير أصلي واستخدام خوارزمية الغابة العشوائية (RF) لحساب درجات الأهمية. تستمر هذه العملية التكرارية حتى يتم تصنيف جميع المتغيرات على أنها مهمة أو غير مهمة، حيث تظهر طريقة بوروتا فعالية متفوقة في تحديد المتغيرات غير ذات الصلة مقارنة بتقنيات الاختيار التقليدية.
في دراستهم، استخدم المؤلفون خوارزمية بوروتا ضمن بيئة برمجة R، مع التركيز على الكتلة الحيوية لأربعة أنواع غابات متميزة كمتغير تابع، بينما قاموا بتحليل 70 عامل ميزات مستقل. تم تصنيف المتغيرات إلى ثلاث تصنيفات: مؤكدة، مؤقتة، ومرفوضة، مع ترتيب أهميتها وفقاً لذلك. من الجدير بالذكر أن التحليل كشف أن المتغيرات المهمة اختلفت عبر أنواع الغابات المختلفة، حيث تم اعتبار أكثر من 20 متغيراً مهماً لنمذجة الكتلة الحيوية في الغابات الصنوبرية دائمة الخضرة. يبرز هذا الاكتشاف ضرورة اختيار متغيرات مخصصة لكل نوع غابة للحفاظ على دقة النموذج، حيث أدى دمج جميع العوامل بشكل عشوائي إلى نتائج محاكاة دون المستوى. في النهاية، حدد المؤلفون أعلى 12 متغيراً مهماً لنمذجة الكتلة الحيوية في كل نوع غابة.
النتائج
ركزت نتائج الدراسة على بناء والتحقق من نماذج تقدير الكتلة الحيوية لمختلف أنواع الغابات في شينجيانغ، باستخدام خوارزميات آلة الدعم الناقل (SVM)، XGBoost، والغابة العشوائية (RF). أظهر نموذج SVM قيم R² تتراوح بين 0.38 إلى 0.62، مع ملاءمة جيدة لغابة الإبر الخضراء الدائمة (ENF) وغابة الأوراق العريضة المتساقطة (DBF)، بينما أظهرت غابة الإبر المتساقطة (DNF) والغابة المختلطة (MF) ملاءمة أقل. بالمقابل، حقق نموذج XGBoost قيم R² تتراوح بين 0.21 و0.56، مع أداء ENF مرة أخرى الأفضل. تفوق نموذج RF على الآخرين، محققاً أعلى دقة عبر جميع أنواع الغابات، وخاصة بالنسبة لـ ENF (R² = 0.68) وMF (R² = 0.73)، مما يشير إلى أن التمييز بين أنواع الغابات يعزز بشكل كبير دقة تقدير الكتلة الحيوية.
بالإضافة إلى ذلك، وجدت الدراسة أن متوسط الكتلة الحيوية فوق الأرض (AGB) في شينجيانغ كان 152.01 Mg/hm²، متجاوزاً المتوسط الوطني بسبب انتشار الأشجار الناضجة. كشفت التحليلات المقارنة مع الدراسات السابقة أنه على الرغم من وجود اختلافات في تقديرات AGB، كانت نتائج الدراسة الحالية متسقة مع أبحاث أخرى، خاصة بالنسبة لـ ENF وDNF، حيث كانت الأخطاء النسبية بشكل عام ضمن 20%. تم عزو التباينات في تقديرات الكتلة الحيوية إلى اختلافات في فترات الدراسة، والمنهجيات، والعوامل البيئية، التي أثرت بشكل خاص على غابات Populus euphratica. بشكل عام، تؤكد الدراسة على أهمية استخدام تقنيات النمذجة المناسبة وأخذ تمييز نوع الغابة في الاعتبار لتقديرات دقيقة للكتلة الحيوية.
المناقشة
في هذا القسم، تناقش الدراسة الخصائص البيئية والمناخية لشينجيانغ، الصين، مع التركيز على مناخها الجاف وأنواع الغابات المتنوعة، والتي تشمل الغابات الصنوبرية دائمة الخضرة، والغابات الصنوبرية المتساقطة، والغابات العريضة الأوراق المتساقطة، والغابات المختلطة. تستخدم البحث بيانات مسح غابات شاملة وصور استشعار عن بعد لتقدير الكتلة الحيوية فوق الأرض (AGB) عبر هذه الأنواع من الغابات. يتم استخدام طريقة عامل التوسع المستمر للكتلة الحيوية (CBEF) لتحويل حجم الغابة إلى كتلة حيوية، مما يحسن الدقة من خلال دمج عوامل التحويل المحددة حسب الفئة العمرية. كما تبرز الدراسة أهمية العوامل المناخية والطبوغرافية في تقدير الكتلة الحيوية، مشيرة إلى أن درجة الحرارة وبيانات نموذج الارتفاع الرقمي (DEM) كانت حاسمة في تطوير نماذج عكس الكتلة الحيوية.
تستخدم البحث تقنيات التعلم الآلي، وتحديداً آلة الدعم الناقل (SVM)، وتعزيز التدرج المتطرف (XGBoost)، والغابة العشوائية (RF)، لتعزيز توقعات الكتلة الحيوية. من بين هذه، أظهر نموذج RF دقة واستقراراً متفوقين، خاصة للهياكل الغابية المعقدة، مع قيم R² تتراوح بين 0.65 إلى 0.75 عبر أنواع الغابات المختلفة. تؤكد الدراسة على أهمية اختيار المتغيرات المناسبة، مثل مؤشرات الغطاء النباتي والعوامل المناخية، لتحسين أداء النموذج. وتخلص إلى أن التمييز بين أنواع الغابات يعزز بشكل كبير دقة تقدير الكتلة الحيوية، داعية إلى دمج بيانات المسح الحديثة وتقنيات النمذجة المتقدمة في الأبحاث المستقبلية لتحسين تقييمات الكتلة الحيوية في شينجيانغ والمناطق المماثلة.
DOI: https://doi.org/10.1038/s41598-025-90906-3
PMID: https://pubmed.ncbi.nlm.nih.gov/39979476
Publication Date: 2025-02-20
Author(s): Zhou Jia et al.
Primary Topic: Remote Sensing and LiDAR Applications
Overview
This study addresses the critical need for accurate estimations of aboveground biomass (AGB) in forest ecosystems, specifically in Xinjiang, where provincial-level AGB distribution maps are currently lacking. Focusing on four predominant forest types—Evergreen Needleleaf Forest (ENF), Deciduous Needleleaf Forest (DNF), Deciduous Broadleaf Forest (DBF), and Mixed Forest (MF)—the research utilized topographic and meteorological data alongside satellite imagery from Landsat and MODIS. The Boruta algorithm was employed for feature selection, which informed the construction of machine learning models, including support vector machine (SVM), extreme gradient boosting (XGBoost), and random forest (RF), to estimate AGB. The findings revealed that climate, topography, and texture factors significantly influenced model accuracy, with the RF model achieving the highest performance metrics (R² > 0.65, RMSE between 24.42 and 41.75 Mg/hm², and MAE between 30.59 and 60.46 Mg/hm²).
The geographical distribution of forest biomass indicated that areas with high AGB values were primarily located in mountainous regions, such as the Tianshan, Altai, and Kunlun Mountains, as well as the Ili Valley and Tarim River Basin, highlighting significant spatial heterogeneity. The study concludes that integrating climate and topographic features, along with texture factors, enhances AGB estimation models. The developed models provide a robust framework for large-scale forest AGB estimation in arid regions, contributing valuable insights into the role of forests in Xinjiang within the global carbon cycle and offering a foundation for future remote sensing applications in forest biomass assessment.
Methods
In this section, the authors describe their methodology for variable selection using the Boruta algorithm, which is designed to enhance model accuracy by identifying the most relevant features from a larger set of candidate variables. The Boruta method operates by creating shadow variables for each original variable and employing the random forest (RF) algorithm to compute importance scores. This iterative process continues until all variables are classified as important or unimportant, with the Boruta method demonstrating superior effectiveness in identifying irrelevant variables compared to traditional selection techniques.
In their study, the authors utilized the Boruta algorithm within the R programming environment, focusing on the biomass of four distinct forest types as the dependent variable, while analyzing 70 independent feature factors. The variables were categorized into three classifications: confirmed, tentative, and rejected, with their importance ranked accordingly. Notably, the analysis revealed that the significant variables varied across different forest types, with over 20 variables deemed important for biomass modeling in evergreen coniferous forests. This finding highlights the necessity of tailored variable selection for each forest type to maintain model accuracy, as integrating all factors indiscriminately led to suboptimal simulation results. Ultimately, the authors identified the top 12 most important variables for modeling biomass in each forest type.
Results
The results of the study focused on the construction and validation of biomass estimation models for various forest types in Xinjiang, utilizing Support Vector Machine (SVM), XGBoost, and Random Forest (RF) algorithms. The SVM model demonstrated R² values ranging from 0.38 to 0.62, with good fits for Evergreen Needleleaf Forest (ENF) and Deciduous Broadleaf Forest (DBF), while the Deciduous Needleleaf Forest (DNF) and Mixed Forest (MF) showed poorer fits. In contrast, the XGBoost model yielded R² values between 0.21 and 0.56, with ENF again performing best. The RF model outperformed the others, achieving the highest accuracy across all forest types, particularly for ENF (R² = 0.68) and MF (R² = 0.73), indicating that distinguishing between forest types significantly enhances biomass estimation accuracy.
Additionally, the study found that the average aboveground biomass (AGB) in Xinjiang was 152.01 Mg/hm², surpassing the national average due to the prevalence of mature trees. Comparative analyses with previous studies revealed that while there were variations in AGB estimates, the present study’s findings were consistent with other research, particularly for ENF and DNF, where relative errors were generally within 20%. Discrepancies in biomass estimates were attributed to differences in study periods, methodologies, and environmental factors, particularly affecting the Populus euphratica forests. Overall, the study underscores the importance of using appropriate modeling techniques and considering forest type differentiation for accurate biomass assessments.
Discussion
In this section, the study discusses the ecological and climatic characteristics of Xinjiang, China, emphasizing its arid climate and diverse forest types, which include evergreen needleleaf, deciduous needleleaf, deciduous broadleaf, and mixed forests. The research utilizes comprehensive forest survey data and remote-sensing imagery to estimate above-ground biomass (AGB) across these forest types. The Continuous Biomass Expansion Factor (CBEF) method is employed to convert forest volume into biomass, improving accuracy by incorporating age-class specific conversion factors. The study also highlights the importance of climatic and topographic factors in biomass estimation, noting that temperature and digital elevation model (DEM) data were critical in developing biomass inversion models.
The research employs machine learning techniques, specifically Support Vector Machine (SVM), Extreme Gradient Boosting (XGBoost), and Random Forest (RF), to enhance biomass predictions. Among these, the RF model demonstrated superior accuracy and stability, particularly for complex forest structures, with R² values ranging from 0.65 to 0.75 across different forest types. The study underscores the significance of selecting appropriate feature variables, such as vegetation indices and climatic factors, to improve model performance. It concludes that distinguishing between forest types significantly enhances biomass estimation accuracy, advocating for the integration of contemporary survey data and advanced modeling techniques in future research to refine biomass assessments in Xinjiang and similar regions.
