DOI: https://doi.org/10.1038/s41597-024-02921-0
PMID: https://pubmed.ncbi.nlm.nih.gov/38228637
تاريخ النشر: 2024-01-16
المؤلف: Michael F. Meyer وآخرون
الموضوع الرئيسي: النظم البيئية البحرية والساحلية
نظرة عامة
تناقش هذه القسم أهمية حالة التغذية في البحيرات كمؤشر أساسي لصحة النظام البيئي، من خلال دمج العمليات الفيزيائية والكيميائية والبيولوجية المختلفة. على الرغم من أهميتها في تقييم جودة مياه البحيرات، إلا أن البيانات القياسية والقابلة للقراءة الآلية حول حالات التغذية نادرة. استخدم المؤلفون بيانات انعكاس سطح لاندسات لجمع مجموعة بيانات شاملة لحالات التغذية السنوية لـ 55,662 بحيرة عبر الولايات المتحدة المتجاورة من 1984 إلى 2020. تتماشى هذه المجموعة مع مبادئ بيانات FAIR، مما يضمن أنها قابلة للاكتشاف والوصول والتشغيل المتبادل وإعادة الإنتاج، وبالتالي توفر موردًا قيمًا لكل من البحث الأساسي والتطبيقي حول جودة مياه البحيرات.
تؤكد الخلفية على الدور الحاسم للبحيرات والخزانات في توفير خدمات أساسية مثل مياه الشرب وإنتاج الغذاء والصرف الصحي. كما تسلط الضوء على التحديات التي تطرحها العوامل المناخية والبشرية التي تؤثر على توفر المياه وجودتها، والتي غالبًا ما تكون غير متجانسة. يدعو المؤلفون إلى استخدام تقنيات الاستشعار عن بعد لتعزيز فهم النظم البيئية للمياه العذبة، مشيرين إلى أنه بينما ركزت الدراسات السابقة على كمية المياه، فإن التقدم في الاستشعار عن بعد يمكّن الآن من تقييمات أكثر شمولاً لجودة المياه. يسمح هذا التحول بتتبع أفضل للتغيرات في أنماط وجودة المياه والاتجاهات، مما يسهل تحسين تنسيق البيانات بين القياسات في الموقع وصور الاستشعار عن بعد.
طرق
تم تطوير مجموعة بيانات LTS-US من خلال خط أنابيب منهجي مكون من أربعة أجزاء. تتضمن الخطوة الأولى تجميع بيانات التدريب، التي تشكل الأساس للتحليلات اللاحقة. بعد ذلك، يتم إنشاء نماذج التصنيف بناءً على البيانات المجمعة. تتضمن الخطوة الثالثة تطبيق هذه النماذج للتنبؤ بالنتائج للبحيرات التي لم يتم تضمينها في مجموعة بيانات التدريب. أخيرًا، يتم تقييم أداء النماذج وصحة التنبؤات لضمان القوة والدقة. كل من هذه الخطوات حاسمة لبناء وتقييم مجموعة البيانات بشكل فعال.
نقاش
في هذا القسم، يوضح المؤلفون المنهجية لتقييم حالات التغذية في البحيرات باستخدام بيانات من تقييم البحيرات الوطني لوكالة حماية البيئة الأمريكية (NLA)، وHydroLAKES، وLimnoSat-US. يوفر NLA قياسات في الموقع للفوسفور الكلي واللون الحقيقي من البحيرات التي تم أخذ عينات منها خلال أشهر الصيف عبر ثلاث سنوات تقييم (2007، 2012، و2017). تستخدم الدراسة تصميم عينة عشوائية مصنفة بناءً على المناطق البيئية ومساحة سطح البحيرة، مما يضمن تمثيلًا شاملاً لبحيرات الولايات المتحدة. تكمل مجموعة بيانات HydroLAKES ذلك من خلال تقديم بيانات مكانية وشكلية لأكثر من 1.4 مليون بحيرة على مستوى العالم، بينما توفر LimnoSat-US ملاحظات مستشعرة عن بعد شاملة لانعكاس سطح البحيرة من 1984 إلى 2020.
يحدد المؤلفون حالات التغذية في البحيرات باستخدام نموذج لون المغذيات (NCP)، الذي يصنف البحيرات إلى أوليجوتروفيك، ويوتروفيك، ودستروفيك، ومختلط التغذية بناءً على عتبات الفوسفور الكلي واللون الحقيقي. يجدون أن معظم البحيرات تبقى مستقرة في حالة تغذيتها طوال الصيف، مع انتقال نسبة صغيرة فقط بين الحالات. لإنشاء مجموعة بيانات تدريب لنمذجة التنبؤ، يقوم المؤلفون بتجميع بيانات NLA مع صور LimnoSat-US، مع تطبيع قيم الانعكاس لتمييز بين حالات التغذية. يتم استخدام ثلاثة نماذج تصنيف—الانحدار اللوجستي المتعدد، وتعزيز التدرج المتطرف، والشبكات العصبية متعددة الطبقات—للتنبؤ بحالات التغذية، مع تقييم الأداء من خلال مقاييس الدقة وتحليل SHAP لتوضيح أهمية الميزات. تتضمن مجموعة بيانات LTS-US الناتجة، المتاحة للوصول العام، تنبؤات فئوية والاحتمالات المرتبطة بكل مجموعة بحيرة-سنة، مما يسهل المزيد من البحث والتحليل.
DOI: https://doi.org/10.1038/s41597-024-02921-0
PMID: https://pubmed.ncbi.nlm.nih.gov/38228637
Publication Date: 2024-01-16
Author(s): Michael F. Meyer et al.
Primary Topic: Marine and coastal ecosystems
Overview
The section discusses the significance of lake trophic state as an essential indicator of ecosystem health, integrating various physical, chemical, and biological processes. Despite its importance for assessing lake water quality, standardized and machine-readable data on trophic states are scarce. The authors utilized Landsat surface reflectance data to compile a comprehensive dataset of annual lake trophic states for 55,662 lakes across the contiguous United States from 1984 to 2020. This dataset adheres to FAIR data principles, ensuring it is findable, accessible, interoperable, and reproducible, thereby providing a valuable resource for both basic and applied research on lake water quality.
The background emphasizes the critical role of lakes and reservoirs in providing essential services such as drinking water, food production, and sanitation. It highlights the challenges posed by climatic and anthropogenic factors that affect water availability and quality, which are often heterogeneous. The authors advocate for the use of remote sensing technologies to enhance understanding of freshwater ecosystems, noting that while previous studies have focused on water quantity, advancements in remote sensing now enable more extensive assessments of water quality. This shift allows for better tracking of changes in water quality patterns and trends, facilitating improved data harmonization between in situ measurements and remote sensing imagery.
Methods
The LTS-US dataset is developed through a systematic four-part pipeline. The initial step involves aggregating training data, which serves as the foundation for subsequent analyses. Following this, classification models are created based on the aggregated data. The third step entails applying these models to predict outcomes for lakes that were not included in the training dataset. Finally, the performance of the models and the validity of the predictions are assessed to ensure robustness and accuracy. Each of these steps is critical for the effective construction and evaluation of the dataset.
Discussion
In this section, the authors detail the methodology for assessing lake trophic states using data from the U.S. Environmental Protection Agency’s National Lakes Assessment (NLA), HydroLAKES, and LimnoSat-US datasets. The NLA provides in situ measurements of total phosphorus and true color from lakes sampled during summer months across three assessment years (2007, 2012, and 2017). The study employs a stratified random sampling design based on ecoregions and lake surface area, ensuring a comprehensive representation of U.S. lakes. The HydroLAKES dataset complements this by offering spatial and morphological data for over 1.4 million lakes globally, while LimnoSat-US provides extensive remotely sensed observations of lake surface reflectance from 1984 to 2020.
The authors define lake trophic states using the Nutrient Color Paradigm (NCP), which categorizes lakes into oligotrophic, eutrophic, dystrophic, and mixotrophic based on total phosphorus and true color thresholds. They find that most lakes remain stable in their trophic state throughout the summer, with only a small percentage transitioning between states. To create a training dataset for predictive modeling, the authors aggregate NLA data with LimnoSat-US imagery, normalizing reflectance values to differentiate among trophic states. Three classification models—multinomial logistic regression, extreme gradient boosting, and multilayer perceptrons—are employed to predict trophic states, with performance assessed through accuracy metrics and SHAP analysis to elucidate feature importance. The resulting LTS-US dataset, available for public access, includes categorical predictions and associated probabilities for each lake-year combination, facilitating further research and analysis.
