GLC_FCS10: مجموعة بيانات عالمية لتغطية الأرض بدقة 10 أمتار مع نظام تصنيف دقيق من بيانات السلاسل الزمنية Sentinel-1 وSentinel-2 في Google Earth Engine
GLC_FCS10: a global 10 m land-cover dataset with a fine classification system from Sentinel-1 and Sentinel-2 time-series data in Google Earth Engine

المجلة: Earth system science data، المجلد: 17، العدد: 8
DOI: https://doi.org/10.5194/essd-17-4039-2025
تاريخ النشر: 2025-08-21
المؤلف: Xiao Zhang وآخرون
الموضوع الرئيسي: الاستشعار عن بعد في الزراعة

نظرة عامة

تقدم البحث إطار عمل هرمي جديد لرسم خرائط تغطية الأراضي عالية الدقة، مما يؤدي إلى نظام التصنيف الدقيق لتغطية الأراضي العالمية بدقة 10 م (GLC_FCS10). باستخدام بيانات السلاسل الزمنية من Sentinel-1 و Sentinel-2، يتضمن الإطار عينات تدريب موزعة عالميًا تم تحسينها من منتجات تغطية الأراضي السابقة المختلفة. تجمع المنهجية بين رسم الخرائط الهرمي، والنمذجة التكيفية المحلية، وميزات متعددة المصادر لإنشاء خرائط تغطية أراضٍ مفصلة لقطع جغرافية بمساحة 5 × 5.

تظهر نتائج التحقق من GLC_FCS10، استنادًا إلى 56,121 عينة موزعة عالميًا ومجموعة بيانات طرف ثالث (LCMAP_Val)، دقة إجمالية تبلغ 83.16% ومعامل κ قدره 0.789 عالميًا، مع تحسين الدقة إلى 85.09% في الولايات المتحدة. تشير التحليلات المقارنة مع منتجات تغطية الأراضي الحالية بدقة 10 م و 30 م إلى أن GLC_FCS10 يتفوق على ثلاثة من مجموعات البيانات العالمية بدقة 10 م من حيث الدقة وتنوع أنواع تغطية الأراضي. من المتوقع أن تعزز هذه التطورات في رسم خرائط تغطية الأراضي بشكل كبير الأبحاث والتطبيقات التي تتطلب بيانات تغطية أراضٍ عالية الدقة.

مقدمة

تسلط المقدمة الضوء على الدور الحاسم لمعلومات تغطية الأراضي في معالجة تغير المناخ العالمي، والحفاظ على التنوع البيولوجي، وأمن الغذاء. أدت التطورات الأخيرة في تكنولوجيا الأقمار الصناعية إلى تطوير مجموعة متنوعة من منتجات تغطية الأراضي العالمية، مع دقة تتراوح من 1 كم إلى 10 م. على الرغم من توفر أربعة منتجات تغطية أراضٍ عالمية بدقة 10 م، فإن أنظمة التصنيف الحالية بسيطة، مما يحد من قابليتها للاستخدامات المحددة. علاوة على ذلك، تشير الدراسات إلى أن هذه المنتجات تظهر تناسقًا ودقة منخفضة، مما يبرز الحاجة إلى مجموعة بيانات تغطية أراضٍ عالمية أكثر دقة مع نظام تصنيف محسّن.

تناقش هذه الفقرة طريقتين رئيسيتين لتوليد عينات تدريب لتصنيف تغطية الأراضي: التفسير البصري والاستخراج الآلي من مجموعات البيانات الحالية. بينما يضمن التفسير البصري عينات تدريب عالية الجودة، إلا أنه يستغرق وقتًا طويلاً ويكون مكلفًا. على العكس من ذلك، يمكن أن تنتج الطرق الآلية عينات تدريب بكفاءة ولكنها تخاطر بنقل الأخطاء من مجموعات البيانات السابقة. تتناول المقدمة أيضًا التحديات في رسم خرائط تغطية الأراضي العالمية، وخاصة عدم كفاية نماذج التصنيف الفردية لأنواع تغطية الأراضي المعقدة. لتعزيز دقة الرسم، تم اقتراح استراتيجيات مثل النمذجة التكيفية المحلية، ورسم الخرائط الهرمي، ودمج مجموعات البيانات متعددة المصادر. يهدف هذا البحث إلى تطوير منتج تغطية أراضٍ عالمي جديد بدقة 10 م (GLC_FCS10) يتضمن 30 نوعًا دقيقًا من تغطية الأراضي باستخدام صور السلاسل الزمنية من Sentinel-1 و Sentinel-2، معتمدًا على إطار عمل هرمي ومجموعة تدريب قوية لتحسين دقة التصنيف.

الطرق

تستخدم المنهجية المقترحة لرسم خرائط تغطية الأراضي العالمية بدقة 10 م عالية الجودة نهجًا هرميًا يدمج منتجات تغطية الأراضي السابقة متعددة المصادر مع ملاحظات الأقمار الصناعية السلسلية. يركز هذا الأسلوب على التصنيف المتميز للأسطح غير المنفذة والأراضي الرطبة، معترفًا بخصائصها الهيكلية الفريدة وخصائصها الطيفية المعقدة المتأثرة بالعوامل البيئية مثل الفينولوجيا ومستويات المياه. أشارت الدراسات السابقة إلى أنه يمكن تحسين دقة هذه الأنواع من تغطية الأراضي من خلال دمج المعرفة السابقة الإضافية واستراتيجيات رسم الخرائط الموضوعية.

تتكون المنهجية من أربع إجراءات رئيسية: (1) توليد عينات تدريب هرمية وموزعة عالميًا من منتجات تغطية الأراضي الحالية؛ (2) تجميع ميزات التدريب متعددة المصادر ومتعددة الأوقات المستمدة من صور Sentinel 1 و 2؛ (3) إجراء رسم خرائط تغطية الأراضي الهرمي من خلال تصنيفات محلية تكيفية؛ و (4) إجراء تقييمات دقة ومقارنات متقاطعة للتحقق من النتائج. يهدف هذا النهج المنظم إلى تحسين دقة تصنيفات تغطية الأراضي، وخاصة للأسطح غير المنفذة والأراضي الرطبة، مما يسهم في مراقبة وإدارة بيئية أكثر موثوقية.

النتائج

تقدم فقرة النتائج النتائج المستخلصة من الدراسة، مع تسليط الضوء على النتائج الرئيسية المستمدة من الأساليب التجريبية أو التحليلية المستخدمة. تناقش الفقرة تداعيات هذه النتائج بالنسبة للفرضيات المطروحة في بداية البحث. تشير البيانات إلى اتجاهات أو أنماط مهمة تدعم التوقعات الأولية، مع تأكيد التحليلات الإحصائية على قوة النتائج.

علاوة على ذلك، توضح الفقرة أهمية النتائج في السياق الأوسع للمجال، مقارنتها بالدراسات السابقة والأطر النظرية. تؤكد المناقشة على التطبيقات المحتملة للنتائج وتقترح اتجاهات للبحث المستقبلي، مع معالجة أي قيود تم مواجهتها خلال الدراسة. بشكل عام، تسهم النتائج في تقديم رؤى قيمة تعزز الفهم في مجال الموضوع.

المناقشة

في هذه الفقرة، يناقش المؤلفون المنهجيات المستخدمة لتوليد مجموعة بيانات تغطية أراضٍ عالمية بدقة 10 م، مؤكدين على أهمية عينات التدريب عالية الجودة المستمدة من مجموعات بيانات موجودة متنوعة. تستخدم الدراسة صور الأقمار الصناعية من Sentinel-2 و Sentinel-1، التي تم تصحيحها ومعالجتها لضمان دقة وجودة مثلى. بشكل خاص، يبرز المؤلفون استبعاد بعض الأطياف الطيفية لتقليل التداخل الجوي وإعادة أخذ عينات من الأطياف ذات الدقة المنخفضة لتتناسب مع الدقة المطلوبة 10 م. يتم توليد عينات التدريب للأسطح غير المنفذة والأراضي الرطبة من عدة منتجات تغطية أراضٍ عالية الدقة، بينما يتم اشتقاق أنواع تغطية الأراضي الطبيعية غير الرطبة من مجموعة بيانات GLC_FCS30D، التي تلتقط ديناميات تغطية الأراضي على مدى عدة عقود.

كما يوضح المؤلفون النهج الهرمي لتصنيف تغطية الأراضي، الذي يفصل بين الأسطح غير المنفذة وتغطيات الأراضي الطبيعية ويصنف أيضًا الأراضي الرطبة وأنواع تغطية الأراضي الطبيعية غير الرطبة. يعزز هذا الأسلوب دقة رسم خرائط تغطية الأراضي من خلال استخدام نماذج مستقلة لتغطيات الأراضي المعقدة. تستخدم الدراسة أخذ عينات مصنفة لضمان تمثيل متوازن لمختلف أنواع تغطية الأراضي، مع اهتمام خاص بتوزيع عينات التدريب بناءً على مساحة تغطية الأراضي. بالإضافة إلى ذلك، يساعد استخدام طرق التجميع المعتمدة على النسب المئوية لكل من البيانات البصرية وبيانات SAR في تقليل الضوضاء وتحسين قوة ميزات التدريب. بشكل عام، يقدم البحث إطار عمل شامل لتوليد واستخدام عينات تدريب عالية الجودة لتحقيق رسم خرائط تغطية أراضٍ عالمية دقيقة.

القيود

يقدم البحث منتج GLC_FCS10، الذي يتميز بتصنيف مفصل لـ 30 نوعًا من تغطية الأراضي ويظهر دقة محسّنة مقارنة بالنماذج السابقة. ومع ذلك، لا تزال هناك عدة قيود تستدعي مزيدًا من التحقيق. من الجدير بالذكر أن دقة التصنيفات للأراضي الشجرية، والأراضي العشبية، والأراضي الرطبة لا تزال دون المستوى الأمثل، مما يشير إلى أن دمج العوامل المناخية وعوامل التضاريس، بالإضافة إلى دمج بيانات الليدار والبيانات البصرية، قد يعزز التعرف على هذه الأنواع المعقدة من تغطية الأراضي. بالإضافة إلى ذلك، على الرغم من أن استخدام سلاسل زمنية من Sentinel-1 و Sentinel-2 يقلل من تأثيرات السحب والظلال، إلا أن المناطق الملوثة بالسحب العالية لا تزال تمثل تحديات، مما يشير إلى الحاجة إلى تحسين المنهجيات باستخدام صور Landsat وتقنيات التعلم العميق المتقدمة.

يعتمد التحقق من GLC_FCS10 على مجموعة بيانات موزعة عالميًا ومجموعة بيانات تحقق من طرف ثالث (LCMAP_Val)، ومع ذلك تظل مقاييس الدقة لنظام التصنيف الدقيق غير مؤكدة بسبب الصعوبات الجوهرية في جمع بيانات تحقق واسعة النطاق عبر 30 نوعًا من تغطية الأراضي. ستركز الجهود المستقبلية على الاستفادة من نقاط تحقق عالية الجودة الموجودة لتحسين دقة التصنيف. علاوة على ذلك، قد تؤدي التباينات في تعريفات التصنيف بين مجموعات البيانات إلى تحريف تقييمات الدقة، مما يستدعي الحاجة إلى طرق تقييم أكثر شمولاً. أخيرًا، أدت تنفيذ استراتيجيات النمذجة التكيفية المحلية إلى احتمالية وجود انقطاعات مكانية في خرائط تغطية الأراضي المجاورة، والتي سيتم تناولها في الأبحاث الجارية لتعزيز التماسك المكاني عبر تمثيلات تغطية الأراضي العالمية.

Journal: Earth system science data, Volume: 17, Issue: 8
DOI: https://doi.org/10.5194/essd-17-4039-2025
Publication Date: 2025-08-21
Author(s): Xiao Zhang et al.
Primary Topic: Remote Sensing in Agriculture

Overview

The research presents a novel hierarchical framework for high-resolution land-cover mapping, resulting in the Global Land Cover Fine Classification System at 10 m resolution (GLC_FCS10). Utilizing Sentinel-1 and Sentinel-2 time-series data, the framework incorporates globally distributed training samples refined from various prior land-cover products. The methodology combines hierarchical mapping, local adaptive modeling, and multisource features to generate detailed land-cover maps for 5 × 5 geographical tiles.

Validation of the GLC_FCS10, based on 56,121 globally distributed samples and a third-party dataset (LCMAP_Val), reveals an overall accuracy of 83.16% and a κ coefficient of 0.789 globally, with an improved accuracy of 85.09% in the United States. Comparative analyses with existing 10 m and 30 m land-cover products indicate that GLC_FCS10 outperforms three of the global 10 m datasets in accuracy and diversity of land-cover types. This advancement in land-cover mapping is expected to significantly enhance research and applications requiring high-resolution land-cover data.

Introduction

The introduction highlights the critical role of land-cover information in addressing global climate change, biodiversity conservation, and food security. Recent advancements in satellite technology have led to the development of various global land-cover products, with resolutions ranging from 1 km to 10 m. Despite the availability of four global 10 m land-cover products, existing classification systems are simplistic, limiting their applicability for specific uses. Furthermore, studies indicate that these products exhibit low consistency and accuracy, underscoring the need for a more precise global land-cover dataset with a refined classification system.

The section discusses two primary methods for generating training samples for land-cover classification: visual interpretation and automated derivation from existing datasets. While visual interpretation ensures high-quality training samples, it is time-consuming and costly. Conversely, automated methods can efficiently produce training samples but risk transferring errors from prior datasets. The introduction also addresses the challenges in global land-cover mapping, particularly the inadequacy of single classification models for complex land-cover types. To enhance mapping accuracy, strategies such as local adaptive modeling, hierarchical mapping, and the integration of multisource datasets have been proposed. This research aims to develop a novel global 10 m land-cover product (GLC_FCS10) that incorporates 30 fine land-cover types using Sentinel-1 and Sentinel-2 time-series imagery, employing a hierarchical framework and a robust training pool to improve classification accuracy.

Methods

The proposed methodology for high-quality global 10 m land-cover mapping employs a hierarchical approach that integrates multisource prior land-cover products with time-series satellite observations. This method emphasizes the distinct categorization of impervious surfaces and wetlands, recognizing their unique structural characteristics and complex spectral properties influenced by environmental factors such as phenology and water levels. Previous studies have indicated that enhancing the accuracy of these land-cover types can be achieved through the incorporation of additional prior knowledge and thematic mapping strategies.

The methodology consists of four key procedures: (1) generating hierarchical and globally distributed training samples from existing land-cover products; (2) compositing multisource and multitemporal training features derived from Sentinel 1 and 2 imagery; (3) conducting hierarchical land-cover mapping through local adaptive classifications; and (4) performing accuracy assessments and cross-comparisons to validate the results. This structured approach aims to improve the precision of land-cover classifications, particularly for impervious surfaces and wetlands, thereby contributing to more reliable environmental monitoring and management.

Results

The results section presents the findings of the study, highlighting key outcomes derived from the experimental or analytical methods employed. It discusses the implications of these results in relation to the hypotheses posed at the outset of the research. The data indicates significant trends or patterns that support the initial predictions, with statistical analyses confirming the robustness of the findings.

Furthermore, the section elaborates on the relevance of the results within the broader context of the field, comparing them to previous studies and theoretical frameworks. The discussion emphasizes the potential applications of the findings and suggests directions for future research, addressing any limitations encountered during the study. Overall, the results contribute valuable insights that advance understanding in the subject area.

Discussion

In this section, the authors discuss the methodologies employed for generating a global 10 m land-cover dataset, emphasizing the importance of high-quality training samples derived from various existing datasets. The study utilizes Sentinel-2 and Sentinel-1 satellite imagery, which were atmospherically corrected and processed to ensure optimal resolution and quality. Specifically, the authors highlight the exclusion of certain spectral bands to minimize atmospheric interference and the resampling of lower-resolution bands to match the desired 10 m resolution. The training samples for impervious surfaces and wetlands are generated from multiple high-accuracy land-cover products, while non-wetland natural land-cover types are derived from the GLC_FCS30D dataset, which captures land-cover dynamics over several decades.

The authors also detail the hierarchical approach to land-cover classification, which separates impervious surfaces from natural land covers and further categorizes wetlands and non-wetland natural land-cover types. This method enhances the accuracy of land-cover mapping by utilizing independent models for complex land covers. The study employs stratified sampling to ensure balanced representation of different land-cover types, with specific attention to the distribution of training samples based on land-cover area. Additionally, the use of percentile-based compositing methods for both optical and SAR data helps to mitigate noise and improve the robustness of the training features. Overall, the research presents a comprehensive framework for generating and utilizing high-quality training samples to achieve accurate global land-cover mapping.

Limitations

The research presents the GLC_FCS10 product, which features a detailed classification of 30 land-cover types and demonstrates improved accuracy over previous models. However, several limitations persist that warrant further investigation. Notably, the accuracy of classifications for shrubland, grassland, and wetland remains suboptimal, suggesting that integrating climatic and landform factors, as well as combining lidar and optical data, could enhance recognition of these complex land-cover types. Additionally, while the use of Sentinel-1 and Sentinel-2 time series mitigates cloud and shadow effects, high cloud-contaminated areas still pose challenges, indicating a need for improved methodologies utilizing Landsat imagery and advanced deep learning techniques.

The validation of GLC_FCS10 relies on a globally distributed dataset and a third-party validation dataset (LCMAP_Val), yet the accuracy metrics for the fine classification system remain uncertain due to the inherent difficulties in collecting extensive validation data across 30 land-cover types. Future efforts will focus on leveraging existing high-quality validation points to refine the classification accuracy. Furthermore, discrepancies in classification definitions between datasets may skew accuracy assessments, prompting the need for more comprehensive evaluation methods. Lastly, the implementation of local adaptive modeling strategies has resulted in potential spatial discontinuities in neighboring land-cover maps, which will be addressed in ongoing research to enhance spatial coherence across global land-cover representations.