تحسين تصميم العينة لتقدير الكلوروفيل-أ في المياه الداخلية باستخدام صور ساتل-2 والتجمع المكاني
Optimizing Sampling Design for Chlorophyll-a Estimation in Inland Waters Using Sentinel-2 Imagery and Spatial Clustering

المجلة: ˜The œinternational archives of the photogrammetry, remote sensing and spatial information sciences/International archives of the photogrammetry, remote sensing and spatial information sciences
DOI: https://doi.org/10.5194/isprs-archives-xlviii-3-w4-2025-33-2026
تاريخ النشر: 2026-01-19
المؤلف: Azucena Pérez-Vega وآخرون
الموضوع الرئيسي: النظم البيئية البحرية والساحلية

نظرة عامة

تتناول هذه الدراسة التحديات المتعلقة بمراقبة جودة المياه في المسطحات المائية الداخلية، مع التركيز بشكل خاص على سد سوليس في المكسيك. غالبًا ما تكون طرق أخذ العينات التقليدية مكلفة ومحدودة في التغطية المكانية، مما يدفع لاستكشاف الاستشعار عن بعد كبديل أكثر كفاءة. من خلال استخدام صور Sentinel-2، طور الباحثون نهجًا قائمًا على التجميع لتحسين اختيار مواقع أخذ العينات لتقييم تركيزات الكلوروفيل-أ (Chl-a) والعكارة. تم تحليل سلسلة زمنية لمدة عام من بيانات Sentinel-2، وتم استخدام التجميع K-means لتقسيم الخزان إلى مناطق ذات تباين واضح في جودة المياه. وقد أبلغ ذلك عن وضع 20 موقعًا لأخذ العينات، حيث تم ربط القياسات الميدانية خلال كل من المواسم الجافة والرطبة بمؤشرات طيفية. أظهر مؤشر Gi033BDA أقوى ارتباط مع Chl-a (R² > 0.7، p < 0.01)، مما أدى إلى تطوير نموذج انحدار خطي لتقدير Chl-a. تشير النتائج إلى أن استراتيجية أخذ العينات المستندة إلى التجميع تلتقط بشكل فعال التباين المكاني في جودة المياه، على الرغم من إدخال أخطاء طفيفة بسبب عدم التوافق الزمني وعدم الدقة في مواقع العينات. توضح الدراسة إمكانية دمج الاستشعار عن بعد والنماذج الإحصائية لتعزيز كفاءة أخذ العينات مع الحفاظ على دقة تقديرات جودة المياه. ستركز الأبحاث المستقبلية على معالجة الديناميات المكانية الزمنية واستكشاف مقايضات دقة المستشعر لتوسيع تطبيق هذه الطرق في مراقبة جودة المياه على نطاق واسع.

مقدمة

تناقش المقدمة استخدام النماذج التجريبية لتقييم معايير جودة المياه، مثل تركيز الكلوروفيل والعكارة، في المسطحات المائية الداخلية من خلال دمج العينات الميدانية والصور متعددة الطيف. تستفيد هذه النماذج من العلاقات الإحصائية بين القياسات في الموقع والبيانات الطيفية المستمدة من مصادر مثل Sentinel-2 وLandsat. على وجه الخصوص، يتم استخدام طرق مثل الانحدار الخطي أو غير الخطي ومؤشرات جودة المياه الطيفية، بما في ذلك مؤشر الفرق الطبيعي للكلوروفيل (NDCI)، لتقدير مستويات الكلوروفيل واكتشاف ازدهار الطحالب الضارة، التي تشكل مخاطر على صحة الإنسان. توفر البيانات المجانية للاستشعار عن بعد ذات الدقة المكانية والزمنية العالية هذه الطرق كبدائل فعالة من حيث التكلفة لمراقبة جودة المياه على نطاق واسع، على الرغم من أنها تتطلب التحقق من صحتها مقابل البيانات في الموقع لضمان الدقة.

يؤكد النص على أهمية أخذ عينات كافية لالتقاط تباين معايير جودة المياه بشكل فعال. يشير إلى أن أخذ العينات العشوائية التقليدية قد يكون غير فعال بسبب الاعتماد المكاني، حيث تكون الملاحظات القريبة أكثر تشابهًا من تلك البعيدة. لمعالجة ذلك، يمكن أن تعمل التقنيات الجيستاتية مثل تحليل الارتباط المكاني، والتجميع، والكرينج على تحسين استراتيجيات أخذ العينات. على سبيل المثال، أظهرت الدراسات السابقة أن أخذ العينات الطبقية، المستندة إلى بيانات سابقة (مثل قياسات LiDAR)، يمكن أن يقلل بشكل كبير من أخطاء التنبؤ مقارنة بأخذ العينات العشوائية. وهذا يبرز ضرورة استخدام تصاميم أخذ عينات قوية لتعزيز موثوقية النماذج التجريبية في تقييمات جودة المياه.

الطرق

في هذه الدراسة، تم استخدام الصور متعددة الطيف من كوكبة الأقمار الصناعية Sentinel-2، والتي تتميز بـ 12 نطاقًا طيفيًا عبر الأطوال الموجية المرئية والأشعة تحت الحمراء مع دقة مكانية متغيرة (10، 20، و60 م) ودقة زمنية تبلغ خمسة أيام. تم الحصول على صور الانعكاس السطحي المعالجة مسبقًا (المستوى 2A) من نظام بيانات كوبرنيكوس. تم إجراء معالجة الصور والتحليلات الإحصائية باستخدام برنامج R، مع استخدام حزم محددة لاكتساب الصور، والمعالجة المسبقة، وحساب مؤشرات جودة المياه، ورسم الخرائط. شمل أخذ العينات الميدانية استخدام مسبار متعدد المعلمات HQ40D وزجاجة فان دورن، مع إجراء تحليلات مختبرية لاحقة باستخدام أدوات متنوعة لتقييم معايير جودة المياه.

تضمنت المنهجية تحليلًا أوليًا لصور الأقمار الصناعية لتحديد مواقع أخذ العينات المثلى، تلاها جمع وتحليل عينات المياه. تم حساب المؤشرات الطيفية من الصور الفضائية، وتم فحص ارتباطها مع تركيز الكلوروفيل لتحديد المؤشرات الأكثر تمثيلاً. أكدت الدراسة على أهمية التقاط التباين المكاني الزمني في جودة المياه، لا سيما في المناطق ذات التركيزات المختلفة من الكلوروفيل والمواد الصلبة المعلقة. اقترح المؤلفون الاستفادة من بيانات الاستشعار عن بعد لتقييم مسبق لتوزيع الكلوروفيل، مما يسهل تقسيم جهود أخذ العينات. بالإضافة إلى ذلك، تم تسليط الضوء على حساسية خوارزمية تصنيف الغابة العشوائية لخصائص مجموعة بيانات التدريب، مع الإشارة إلى النتائج من Millard et al. (2015).

النتائج

في هذه الدراسة، تم إجراء تحليل تجميع على الصور الشهرية لعشرين مؤشرًا طيفيًا مرتبطًا بتركيز الكلوروفيل والعكارة، مما أدى إلى تحديد عشرة تجمعات متميزة. تم اختيار عشرين موقعًا لأخذ العينات بشكل استراتيجي لتمثيل تباين تركيزات الكلوروفيل والرواسب عبر الخزان، مع التركيز على المناطق من المدخل إلى السد. ومن الجدير بالذكر أنه لم يتم تعيين أي نقاط أخذ عينات للتجمع 8، الذي يتوافق مع المناطق الجافة عندما يكون مستوى مياه السد منخفضًا. كشفت التحليلات أن مؤشر Gi033BDA الطيفي أظهر أعلى ارتباط مع تركيز الكلوروفيل في الموقع (معامل الارتباط > 0.7، p < 0.01)، مما مكن من تقدير مستويات الكلوروفيل من الصور الفضائية. كما أبرزت الدراسة التباين المكاني الكبير في تركيزات الكلوروفيل، لا سيما خلال ازدهار الطحالب، مع ملاحظات لاختلافات في التركيز بين الأيام المتتالية. أظهر نموذج الانحدار الخطي الملائم للبيانات أن نقاط أخذ العينات المختارة التقطت بشكل كافٍ تباين الكلوروفيل عبر الخزان، مع تداخل بنسبة 60% في توزيع التجمعات بين جلستين لأخذ العينات. تؤكد النتائج فعالية استخدام التصنيف غير المراقب للصور الفضائية لتحسين استراتيجيات أخذ العينات في مراقبة جودة المياه، مع الإشارة أيضًا إلى مصادر محتملة للخطأ المتعلقة بالتأخيرات المكانية والفروق الزمنية بين أخذ العينات في الموقع واكتساب الصور. تقترح الأبحاث أن النهج المقترح للتقسيم يمكن تكييفه لمصادر بيانات الاستشعار عن بعد المختلفة، مما يعزز مراقبة الظواهر المحلية مثل ازدهار الطحالب.

المناقشة

في دراستهم، قدم Lv et al. (2021) طريقة اختيار عينات قائمة على التجميع باستخدام تحليل الهيستوغرام لتعزيز اختيار عينات مميزة لتقييم العلاقة بين تركيز الكلوروفيل المقاس في الموقع ومؤشرات الطيف المستمدة من الصور متعددة الطيف. ركزت الأبحاث على سد سوليس في غواناخواتو، المكسيك، وهي منطقة تأثرت بشكل كبير بالتلوث الناتج عن الأنشطة الصناعية والزراعية. من خلال تحليل صور Sentinel-2 التي تغطي أقل من 40% من السحب على مدى عام، كان الهدف من المؤلفين هو تحديد المناطق ذات التباين الطيفي العالي المرتبط بمعايير جودة المياه. قاموا بحساب مؤشرات طيفية مرتبطة بتركيز الكلوروفيل باستخدام نموذج ثلاثي النطاق معدل، واستخدموا معاملات ارتباط بيرسون لتحديد العلاقات بين هذه المؤشرات ومستويات الكلوروفيل.

شملت الدراسة أخذ عينات ميدانية خلال كل من المواسم الجافة والممطرة لقياس معايير جودة المياه المختلفة، مع التركيز بشكل خاص على تركيز الكلوروفيل. قام المؤلفون بإجراء تحليل تجميعي باستخدام طريقة K-means لتصنيف البيانات الطيفية، واختيار 20 موقعًا لأخذ العينات تمثل تجمعات مختلفة. كما قاموا بتقييم مصادر الخطأ المحتملة، بما في ذلك الانحرافات المكانية بسبب عدم دقة GPS والتباين الزمني الناتج عن التغيرات في جودة المياه مع مرور الوقت. تشير النتائج إلى أن دمج الاستشعار عن بعد مع البيانات الميدانية يمكن أن يقلل بشكل كبير من الجهد والتكاليف المرتبطة بتقييمات جودة المياه مع الحفاظ على تقديرات دقيقة لتركيز الكلوروفيل. ستستكشف الأبحاث المستقبلية الديناميات المكانية الزمنية للمسطحات المائية باستخدام مستشعرات ذات دقة زمنية ومكانية متغيرة.

Journal: ˜The œinternational archives of the photogrammetry, remote sensing and spatial information sciences/International archives of the photogrammetry, remote sensing and spatial information sciences
DOI: https://doi.org/10.5194/isprs-archives-xlviii-3-w4-2025-33-2026
Publication Date: 2026-01-19
Author(s): Azucena Pérez-Vega et al.
Primary Topic: Marine and coastal ecosystems

Overview

This study addresses the challenges of monitoring water quality in inland water bodies, specifically focusing on the Solís Dam in Mexico. Traditional sampling methods are often costly and limited in spatial coverage, prompting the exploration of remote sensing as a more efficient alternative. By utilizing Sentinel-2 imagery, the researchers developed a clustering-based approach to optimize the selection of sampling sites for assessing chlorophyll-a (Chl-a) concentrations and turbidity. A one-year time series of Sentinel-2 data was analyzed, and K-means clustering was employed to stratify the reservoir into zones with distinct water quality variability. This informed the placement of 20 sampling sites, where field measurements during both dry and wet seasons were correlated with spectral indices. The Gi033BDA index exhibited the strongest correlation with Chl-a (R² > 0.7, p < 0.01), leading to the development of a linear regression model for Chl-a estimation. The findings indicate that the clustering-derived sampling strategy effectively captures spatial variability in water quality, although minor errors were introduced due to temporal mismatches and inaccuracies in sample locations. The study demonstrates the potential of integrating remote sensing and statistical models to enhance sampling efficiency while maintaining the accuracy of water quality estimates. Future research will focus on addressing spatiotemporal dynamics and exploring sensor resolution trade-offs to broaden the applicability of these methods in large-scale water quality monitoring.

Introduction

The introduction discusses the use of empirical models for assessing water quality parameters, such as chlorophyll concentration and turbidity, in inland water bodies through the integration of field samples and multispectral imagery. These models leverage statistical relationships between in situ measurements and spectral data derived from sources like Sentinel-2 and Landsat. Specifically, methods such as linear or nonlinear regression and spectral water quality indices, including the Normalized Difference Chlorophyll Index (NDCI), are employed to estimate chlorophyll levels and detect harmful algal blooms, which pose risks to human health. The availability of free remote sensing data with high spatial and temporal resolution positions these methods as cost-effective alternatives for extensive water quality monitoring, although they necessitate validation against in situ data to ensure accuracy.

The text emphasizes the importance of adequate sampling to capture the variability of water quality parameters effectively. It notes that traditional random sampling may be inefficient due to spatial dependence, where nearby observations are more similar than those farther apart. To address this, geostatistical techniques such as spatial correlation analysis, clustering, and kriging can optimize sampling strategies. For instance, previous studies have demonstrated that stratified sampling, informed by prior data (e.g., LiDAR measurements), can significantly reduce prediction errors compared to random sampling. This highlights the necessity of employing robust sampling designs to enhance the reliability of empirical models in water quality assessments.

Methods

In this study, multispectral imagery from the Sentinel-2 satellite constellation was utilized, featuring 12 spectral bands across visible and infrared wavelengths with varying spatial resolutions (10, 20, and 60 m) and a temporal resolution of five days. Pre-processed surface reflectance images (level 2A) were sourced from the Copernicus Data Space Ecosystem. Image processing and statistical analyses were conducted using R software, employing specific packages for image acquisition, preprocessing, water quality index computation, and mapping. Field sampling involved the use of an HQ40D multiparameter probe and a Van Dorn bottle, with subsequent laboratory analyses conducted using various instruments to assess water quality parameters.

The methodology comprised an initial analysis of satellite images to identify optimal sampling locations, followed by the collection and analysis of water samples. Spectral indices were calculated from the satellite imagery, and their correlation with chlorophyll concentration was examined to identify the most representative indices. The study emphasized the importance of capturing the spatiotemporal variability in water quality, particularly in areas with differing concentrations of chlorophyll and suspended solids. The authors proposed leveraging remote sensing data for an a priori assessment of chlorophyll distribution, facilitating the stratification of sampling efforts. Additionally, the sensitivity of the Random Forest classification algorithm to the characteristics of the training dataset was highlighted, referencing findings from Millard et al. (2015).

Results

In this study, a clustering analysis was performed on monthly images of two spectral indices related to chlorophyll concentration and turbidity, resulting in the identification of ten distinct clusters. Twenty sampling sites were strategically selected to represent the variability of chlorophyll and sediment concentrations across the reservoir, with a focus on areas from the inlet to the dam. Notably, no sampling points were assigned to cluster 8, which corresponds to areas that are dry when the dam’s water level is low. The analysis revealed that the Gi033BDA spectral index exhibited the highest correlation with in situ chlorophyll concentration (correlation coefficient > 0.7, p < 0.01), enabling the estimation of chlorophyll levels from satellite imagery. The study also highlighted significant spatial variability in chlorophyll concentrations, particularly during algal blooms, with differences in concentration observed between consecutive days. A linear regression model fitted to the data demonstrated that the selected sampling points adequately captured the chlorophyll variability across the reservoir, with a 60% overlap in cluster distribution between two sampling sessions. The findings underscore the effectiveness of using unsupervised classification of satellite imagery for optimizing sampling strategies in water quality monitoring, while also noting potential sources of error related to spatial lags and temporal discrepancies between in situ sampling and image acquisition. The research suggests that the proposed stratification approach can be adapted for various remote sensing data sources, enhancing the monitoring of localized phenomena such as algal blooms.

Discussion

In their study, Lv et al. (2021) introduced a clustering-based sample selection method utilizing histogram analysis to enhance the selection of distinctive samples for evaluating the relationship between field-measured chlorophyll concentration and spectral indices derived from multispectral images. The research focused on the Solís Dam in Guanajuato, Mexico, a region significantly impacted by pollution from industrial and agricultural activities. By analyzing Sentinel-2 images with less than 40% cloud cover over a one-year period, the authors aimed to identify areas of high spectral variability related to water quality parameters. They calculated spectral indices linked to chlorophyll concentration using a modified tri-band model and employed Pearson’s correlation coefficients to establish relationships between these indices and chlorophyll levels.

The study involved field sampling during both dry and rainy seasons to measure various water quality parameters, with a particular focus on chlorophyll concentration. The authors performed cluster analysis using the K-means method to categorize the spectral data, ultimately selecting 20 sampling sites that represented different clusters. They also evaluated potential sources of error, including spatial offsets due to GPS inaccuracies and temporal heterogeneity from changes in water quality over time. The findings suggest that integrating remote sensing with field data can significantly reduce the effort and costs associated with water quality assessments while maintaining accurate chlorophyll concentration estimates. Future research will further explore the spatiotemporal dynamics of water bodies using sensors with varying temporal and spatial resolutions.