DOI: https://doi.org/10.1038/s41597-025-04817-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40128284
تاريخ النشر: 2025-03-24
المؤلف: Viswadeep Lebakula وآخرون
الموضوع الرئيسي: أثر الضوء على البيئة والصحة
نظرة عامة
توفر مجموعة بيانات LandScan Global (LSG)، التي تم تطويرها سنويًا بواسطة مختبر أوك ريدج الوطني (ORNL)، تمثيلًا عالميًا موزعًا على شبكة بزاوية 30 ثانية قوسية لتوزيع السكان البشريين. من خلال استخدام نموذج داسيميتري متعدد المتغيرات، تقوم مجموعة البيانات بتفكيك بيانات التعداد داخل الحدود الإدارية من خلال دمج المعلومات المساعدة، مما يعكس الخصائص الثقافية والاجتماعية والاقتصادية لكل دولة. لقد كانت هذه المجموعة الفريدة من البيانات ذات أهمية كبيرة لأكثر من عقدين في تقدير السكان المعرضين للخطر، حيث تخدم مختلف أصحاب المصلحة بما في ذلك الوكالات الفيدرالية الأمريكية، والمؤسسات الأكاديمية، والمنظمات الإنسانية.
لقد لعبت LSG دورًا حاسمًا في الاستجابة للطوارئ وجهود التعافي خلال الكوارث الكبيرة، مثل تسونامي المحيط الهندي عام 2004 وزلزال هايتي عام 2010، وكذلك خلال الأزمات الجيوسياسية مثل الحرب الأهلية السورية والغزو الروسي لأوكرانيا عام 2022. في عام 2022، جعلت ORNL مجموعات بيانات LSG من عام 2000 فصاعدًا متاحة للجمهور عبر بوابة LandScan. يوضح هذا الوصف البياني للبيانات المنهجيات المستخدمة، بما في ذلك تطبيق العلوم الجغرافية والتعلم الآلي على البيانات الجغرافية والديموغرافية، ويؤكد على أهميتها في مرونة المدن، وإدارة الطوارئ، والاستجابة للكوارث، والصحة والأمن البشري.
مقدمة
تستعرض مقدمة هذه الورقة البحثية أهمية مجموعات بيانات السكان العالمية الموزعة على شبكة (GGPDs) في تعزيز فهم توزيع السكان بما يتجاوز بيانات التعداد التقليدية. يتم تسليط الضوء على مجموعات بيانات رئيسية مثل سكان العالم الموزع على شبكة (GPW)، ومشروع رسم الخرائط الريفية الحضرية العالمية (GRUMP)، وطبقة الاستيطان البشري العالمية – السكان (GHS-POP)، وWorldPop، وLandScan Global (LSG) لما تتمتع به من منهجيات فريدة، ودقة مكانية، وتطبيقات مقصودة. بينما توفر هذه المجموعات من البيانات رؤى قيمة، فإنها تقدم أيضًا مزايا وقيودًا متفاوتة بناءً على أهداف تطويرها واستراتيجيات دمج البيانات.
تم تطوير GPW، الذي تم تطويره في البداية في عام 1995، من خلال تحديثات متعددة، ليحقق دقة تبلغ 30 ثانية قوسية. يسمح بدمج بيانات مساعدة متنوعة، مما يعزز قابليته للتطبيق عبر التخصصات، على الرغم من أن استراتيجيات الوزن المساحي قد تؤدي إلى عدم دقة في توزيع السكان. في المقابل، تستخدم GRUMP وGHS-POP منهجيات متقدمة لتحسين الدقة المكانية، خاصة في السياقات الديناميكية مثل الاستجابة للكوارث. تتميز مجموعة بيانات LSG، التي تتميز بعدد السكان الصحيح ومنهجيات التفكيك القابلة للتكيف، باستخدام نماذج محددة لكل دولة والتحقق اليدوي لتحسين تقديرات السكان. تهدف الورقة إلى تقديم نظرة شاملة على المنهجيات المستخدمة في LSG، وقوتها، والتحديات التي تطرحها جودة البيانات المتطورة والتقدم العلمي، مما يمهد الطريق لمناقشة مفصلة في الأقسام اللاحقة.
الطرق
تتكون المنهجية المستخدمة في مشروع LandScan Global (LSG) لتفكيك بيانات التعداد إلى خلايا شبكة بزاوية 30 ثانية قوسية من عام 2000 إلى 2022 من ثلاثة مكونات رئيسية: تطبيق معاملات موزونة مستمدة من مجموعات بيانات مساعدة، وتحديد مناطق المصدر بناءً على إجمالي السكان الإداريين والحدود، ونمذجة داسيميتري لدمج هذه العناصر في تقدير سكاني موزع على شبكة. في البداية، من عام 2000 إلى 2014، استخدمت LSG بيانات ذات دقة أقل، مما أدى إلى عدم دقة في توزيع السكان، مثل التمثيل المفرط على طول الطرق. ومع ذلك، أدت التحولات المنهجية حول عام 2015 إلى دمج بيانات جغرافية أكثر دقة وغنية بالسمات، بما في ذلك ميزات المباني ونقاط الاهتمام، مما قلل بشكل كبير من الأخطاء السابقة. تم تحسين مناطق المصدر لتتوافق مع الحدود الإدارية المحددة لكل دولة وتقديرات السكان، مما يعزز دقة توزيعات السكان.
تختلف عملية تقدير السكان الموزعين عالميًا حسب الدولة وتتكيف بناءً على توفر البيانات. خلال الفترة من 2000 إلى 2014، تم توليد تقديرات السكان بشكل منفصل لكل دولة ثم تجميعها. تطورت المنهجية بعد عام 2015 لتشمل آثار المباني، التي تم تحويلها إلى تنسيق راستر لاشتقاق تقديرات سكانية مؤقتة. تمت مقارنة هذه التقديرات مع بيانات السنوات السابقة لتحديث المعاملات وفقًا لذلك. تم تطبيق نموذج داسيميتري على المستوى الإداري، باستخدام معاملات محدثة ومناطق مصدر تاريخية لتوليد سكان اختبار. تضمن هذه العملية التكرارية، التي تشمل التحقق البشري والتعديلات، أن مجموعات بيانات LSG يتم تحسينها باستمرار، مما يعزز موثوقيتها ودقتها مع مرور الوقت.
المناقشة
في قسم المناقشة من الورقة البحثية، يوضح المؤلفون المنهجيات المستخدمة لجمع وتطبيع البيانات الديموغرافية والجغرافية لنمذجة السكان. يؤكدون على أهمية استخدام إجماليات سكانية دقيقة ومتسقة من الوحدات الإدارية الوطنية ودون الوطنية، والتي يتم اشتقاقها من مصادر متنوعة، بما في ذلك التعدادات الوطنية والاستطلاعات المستقلة. تستخدم عملية التطبيع تقديرات السكان في منتصف العام من كتاب الحقائق العالمي لوكالة الاستخبارات المركزية لإنشاء خط أساس عالمي، مما يضمن توافق السكان دون الوطنية مع الأرقام الوطنية المبلغ عنها. تعتبر بيانات الحدود الجغرافية أيضًا حاسمة، حيث تساعد في الحفاظ على سلامة توزيعات السكان من خلال اختيار الوحدات الإدارية المناسبة التي تعكس أنماط التنقل اليومية بدلاً من مجرد المناطق السكنية.
يتم تسليط الضوء على نهج النمذجة الداسيميتري كابتكار رئيسي، مما يسمح بتوزيع بيانات السكان عبر راستر بزاوية 30 ثانية قوسية بناءً على المدخلات الديموغرافية والجغرافية. لكل دولة نموذج مخصص تم تطويره على مدى عقدين، مما يجعل النسخ تحديًا. يصف المؤلفون سير عمل من ثلاثة أجزاء لتحديث تقديرات السكان، والذي يتضمن إعادة معايرة الأوزان باستخدام مجموعات بيانات مساعدة، والتحقق من هذه التقديرات مقابل صور الأقمار الصناعية عالية الدقة، وتطبيق تعديلات يدوية لتصحيح التباينات. تهدف هذه العملية التكرارية إلى تعزيز دقة توزيعات السكان من خلال دمج كل من البيانات الكمية والرؤى النوعية من خبراء الموضوع، مما يعالج في النهاية التعقيدات والقيود المتأصلة في نمذجة بيانات السكان العالمية.
DOI: https://doi.org/10.1038/s41597-025-04817-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40128284
Publication Date: 2025-03-24
Author(s): Viswadeep Lebakula et al.
Primary Topic: Impact of Light on Environment and Health
Overview
The LandScan Global (LSG) dataset, developed annually by Oak Ridge National Laboratory (ORNL), provides a 30 arcsecond global gridded representation of human population distribution. Utilizing a multivariable dasymetric model, the dataset disaggregates census data within administrative boundaries by incorporating ancillary information, thereby reflecting the cultural and socioeconomic characteristics of each country. This unique dataset has been instrumental for over two decades in estimating populations at risk, serving various stakeholders including U.S. federal agencies, academic institutions, and humanitarian organizations.
LSG has played a critical role in emergency response and recovery efforts during significant disasters, such as the 2004 Indian Ocean tsunami and the 2010 Haiti earthquake, as well as during geopolitical crises like the Syrian civil war and the 2022 Russian invasion of Ukraine. In 2022, ORNL made LSG datasets from 2000 onward publicly accessible via the LandScan Portal. This data descriptor outlines the methodologies employed, including the application of geospatial science and machine learning to geographic and demographic data, and emphasizes its relevance in urban resiliency, emergency management, disaster response, and human health and security.
Introduction
The introduction of this research paper outlines the significance of global gridded population datasets (GGPDs) in enhancing the understanding of population distribution beyond traditional census data. Key datasets such as the Gridded Population of the World (GPW), Global Rural Urban Mapping Project (GRUMP), Global Human Settlement Layer-Population (GHS-POP), WorldPop, and LandScan Global (LSG) are highlighted for their unique methodologies, spatial resolutions, and intended applications. While these datasets provide valuable insights, they also present varying advantages and limitations based on their development goals and data integration strategies.
The GPW, initially developed in 1995, has undergone multiple updates, achieving a resolution of 30 arcseconds. It allows for the integration of various ancillary data, enhancing its applicability across disciplines, although its areal weighting strategy may lead to inaccuracies in population distribution. In contrast, GRUMP and GHS-POP utilize advanced methodologies to improve spatial accuracy, particularly in dynamic contexts such as disaster response. The LSG dataset, characterized by integer population counts and adaptable disaggregation methodologies, employs country-specific models and manual validation to refine population estimates. The paper aims to provide a comprehensive overview of the methodologies employed in LSG, their strengths, and the challenges posed by evolving data quality and scientific advancements, setting the stage for a detailed discussion in subsequent sections.
Methods
The methodology employed by the LandScan Global (LSG) project for disaggregating census data into 30 arcsecond grid cells from 2000 to 2022 consists of three main components: the application of weighted coefficients derived from ancillary datasets, the definition of source zones based on administrative population totals and boundaries, and dasymetric modeling to integrate these elements into a gridded population estimate. Initially, from 2000 to 2014, LSG utilized coarser-resolution data, leading to inaccuracies in population distribution, such as overrepresentation along roads. However, a methodological shift around 2015 incorporated more precise and attribute-rich geospatial data, including building features and points of interest, which significantly reduced earlier commission errors. The source zones were refined to align with country-specific administrative boundaries and population estimates, enhancing the accuracy of the population distributions.
The estimation process for global gridded populations varies by country and is adapted based on the availability of data. For the period from 2000 to 2014, population estimates were generated separately for each country and then aggregated. The methodology evolved post-2015 to include building footprints, which were converted into raster format to derive temporary population estimates. These estimates were compared with previous years’ data to update coefficients accordingly. A dasymetric model was applied at the administrative level, utilizing updated coefficients and historical source zones to generate test populations. This iterative process, which includes human validation and adjustments, ensures that the LSG datasets are continuously refined, enhancing their reliability and accuracy over time.
Discussion
In the discussion section of the research paper, the authors detail the methodologies employed to gather and normalize demographic and geographic data for population modeling. They emphasize the importance of using consistent and accurate population totals from national and subnational administrative units, which are derived from various sources, including national censuses and independent surveys. The normalization process utilizes midyear population estimates from the CIA World Factbook to create a global baseline, ensuring that subnational populations align with reported national figures. Geographic boundary data are also critical, as they help maintain the integrity of population distributions by selecting appropriate administrative units that reflect daily mobility patterns rather than merely residential areas.
The dasymetric modeling approach is highlighted as a key innovation, allowing for the distribution of population data across a 30 arcsecond raster based on demographic and geographic inputs. Each country has a tailored model developed over two decades, making replication challenging. The authors describe a three-part workflow for updating population estimates, which includes recalibrating weights using ancillary datasets, validating these estimates against high-resolution satellite imagery, and applying manual modifications to correct discrepancies. This iterative process aims to enhance the accuracy of population distributions by incorporating both quantitative data and qualitative insights from subject matter experts, ultimately addressing the complexities and limitations inherent in global population data modeling.
