DOI: https://doi.org/10.1038/s41597-025-05043-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40301348
تاريخ النشر: 2025-04-29
المؤلف: Kristopher Nolte وآخرون
الموضوع الرئيسي: التنوعات الشكلية والتماثل
نظرة عامة
التعرف الدقيق على أنواع البعوض أمر حاسم للسيطرة الفعالة على الناقلات وإدارة الأمراض المنقولة بواسطة البعوض. غالبًا ما تكون الطرق التقليدية للتعرف المورفولوجي كثيفة العمالة وتتطلب خبرة متخصصة، بينما تعتمد التقنيات الجزيئية، على الرغم من كونها فعالة من حيث التكلفة، بشكل كبير على بيانات جينية شاملة. في هذا السياق، ظهرت قياسات الشكل الهندسي للأجنحة كبديل قابل للتطبيق، حيث تستخدم قياسات هندسية دقيقة لأشكال الأجنحة وأنماط الأوردة لتمييز الأنواع وتحديد التباينات داخل الأنواع.
تقدم هذه الورقة مجموعة بيانات منظمة تتكون من 18,104 صورة لأجنحة البعوض، مأخوذة من 10,500 عينة. كل صورة مصنفة بمعلومات وصفية شاملة، تهدف إلى تسهيل البحث في قياسات الشكل الهندسي للأجنحة وتطوير نماذج التعلم الآلي. تهدف مجموعة البيانات إلى تعزيز جهود مراقبة الناقلات والمساهمة في الأبحاث الجارية في هذا المجال.
مقدمة
تسلط المقدمة الضوء على الدور الحاسم للبعوض كناقلات للعوامل الممرضة مثل حمى الضنك وفيروس زيكا، والتي تفاقمت بسبب التغيرات العالمية مثل الاحترار والعولمة، مما يزيد من انتشارها إلى مناطق جديدة. يعد التعرف الدقيق على الأنواع أمرًا ضروريًا لمراقبة البعوض الفعالة والسيطرة على الناقلات، ومع ذلك، فإن الطرق المورفولوجية التقليدية تستغرق وقتًا طويلاً وتتطلب خبرة كبيرة، والتي تتناقص في هذا المجال. تقدم الطرق البديلة، مثل ترميز الحمض النووي، تحديات في البيئات ذات الموارد المنخفضة، مما يبرز الحاجة إلى أساليب تكميلية.
تظهر قياسات الشكل الهندسي للأجنحة كبديل واعد، حيث تلتقط بشكل فعال التباينات بين الأنواع وداخل الأنواع في أجنحة البعوض، مما يوفر رؤى حول ديناميات السكان. ومع ذلك، فإن العملية اليدوية لتحديد المعالم على صور الأجنحة كثيفة العمالة وعرضة للتحيز. تقدم التطورات الأخيرة في رؤية الكمبيوتر والتعلم الآلي، وخاصة الشبكات العصبية التلافيفية (CNN)، حلولًا آلية لتحديد الأنواع والمعالم، مما يظهر دقة عالية في مهام التصنيف. على الرغم من هذه التقدمات التكنولوجية، فإن نقص مجموعات البيانات عالية الجودة المتاحة للجمهور لا يزال عقبة كبيرة. تقدم هذه الورقة مجموعة بيانات شاملة من صور الأجنحة من 72 نوعًا من البعوض عبر 12 دولة، تم جمعها من 2008 إلى 2024، والتي تدعم كل من الدراسات المورفولوجية التقليدية وتطبيق تقنيات التعلم الآلي، مما يسهل التقدم في أبحاث البعوض واستراتيجيات السيطرة على الناقلات.
طرق
يستعرض قسم “الطرق” الأساليب التجريبية والتحليلية المستخدمة في الدراسة. يوضح التقنيات المحددة المستخدمة لجمع البيانات، بما في ذلك أي أدوات أو برامج تم استخدامها، بالإضافة إلى حجم العينة ومعايير الاختيار. كما يصف القسم الأساليب الإحصائية المطبقة لتحليل البيانات، مما يضمن أن النتائج قوية وموثوقة.
بالإضافة إلى ذلك، قد تتضمن المنهجية وصفًا لأي نماذج رياضية أو معادلات كانت جزءًا لا يتجزأ من التحليل. قد يشمل ذلك تطبيق صيغ أو خوارزميات محددة لتفسير البيانات، بالإضافة إلى أي افتراضات تم إجراؤها خلال العملية. بشكل عام، تم تصميم الطرق لضمان صحة النتائج ولتسهيل إمكانية إعادة الإنتاج في الأبحاث المستقبلية.
نقاش
يتناول قسم النقاش في ورقة البحث مجموعة بيانات شاملة لأجنحة البعوض تم تجميعها من 22 مشروع بحثي تمتد من 2008 إلى 2024، تشمل 10,500 عينة عبر 12 دولة وخمسة قارات. تتضمن مجموعة البيانات طرق جمع متنوعة، مع وجود predominance من العينات الأنثوية (n = 9,049) التي تم التعرف عليها من خلال تقنيات مورفولوجية وجزيئية. يسمح التسلسل الهرمي التصنيفي الذي تم تطويره لهذه المجموعة بتحديد دقيق، مع مراعاة عدم اليقين في تصنيف الأنواع، خاصة بالنسبة للأزواج والمجمعات المورفولوجية المتشابهة.
شملت إعداد الأجنحة تقنيات دقيقة لضمان الحفظ على المدى الطويل، مع التقاط ما مجموعه 18,104 صورة باستخدام معدات تصوير متنوعة. مجموعة البيانات متاحة للجمهور عبر أرشيف Bioimage، منظمة بشكل هرمي حسب المستوى التصنيفي، وتشتمل على بيانات وصفية شاملة لكل صورة. يتم دعم التحقق من مجموعة البيانات من خلال دراسات سابقة تظهر فائدة صور الأجنحة في تحديد الأنواع وتحليل السكان من خلال قياسات الشكل الهندسي وتطبيقات التعلم الآلي. ومع ذلك، يجب على المستخدمين ملاحظة القيود مثل نقص البيانات الوصفية واختلاف ظروف التقاط الصور، والتي قد تؤثر على اتساق البيانات. يشجع المؤلفون على المساهمات لإثراء هذه المجموعة بشكل أكبر مع جمع صور بعوض إضافية.
DOI: https://doi.org/10.1038/s41597-025-05043-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40301348
Publication Date: 2025-04-29
Author(s): Kristopher Nolte et al.
Primary Topic: Morphological variations and asymmetry
Overview
The accurate identification of mosquito species is crucial for effective vector control and the management of mosquito-borne diseases. Traditional methods of morphological identification are often labor-intensive and require specialized expertise, while molecular techniques, although potentially cost-effective, rely heavily on comprehensive genetic data. In this context, wing geometric morphometry has emerged as a viable alternative, utilizing precise geometric measurements of wing shapes and vein patterns to differentiate species and identify intraspecies variations.
This paper introduces a curated dataset comprising 18,104 images of mosquito wings, sourced from 10,500 specimens. Each image is annotated with extensive meta-information, aimed at facilitating research in wing geometric morphometry and the development of machine learning models. The dataset is intended to enhance vector surveillance efforts and contribute to ongoing research in the field.
Introduction
The introduction highlights the critical role of mosquitoes as vectors for pathogens such as dengue and Zika virus, exacerbated by global changes like warming and globalization, which increase their spread into new regions. Accurate species identification is essential for effective mosquito monitoring and vector control, yet traditional morphological methods are time-consuming and require significant expertise, which is declining in the field. Alternative methods, such as DNA barcoding, present challenges in low-resource settings, underscoring the need for complementary approaches.
Wing geometric morphometrics emerges as a promising alternative, effectively capturing interspecific and intraspecific variations in mosquito wings, thus providing insights into population dynamics. However, the manual process of setting landmarks on wing images is labor-intensive and prone to bias. Recent advancements in computer vision and machine learning, particularly Convolutional Neural Networks (CNN), offer automated solutions for species and landmark identification, demonstrating high accuracy in classification tasks. Despite these technological advancements, the lack of publicly available, high-quality datasets remains a significant barrier. This paper introduces a comprehensive dataset of wing images from 72 mosquito taxa across 12 countries, collected from 2008 to 2024, which supports both traditional morphometric studies and the application of machine learning techniques, thereby facilitating advancements in mosquito research and vector control strategies.
Methods
The “Methods” section outlines the experimental and analytical approaches employed in the study. It details the specific techniques used for data collection, including any instruments or software utilized, as well as the sample size and selection criteria. The section also describes the statistical methods applied for data analysis, ensuring that the results are robust and reliable.
Additionally, the methodology may include a description of any mathematical models or equations that were integral to the analysis. This could involve the application of specific formulas or algorithms to interpret the data, as well as any assumptions made during the process. Overall, the methods are designed to ensure the validity of the findings and to facilitate reproducibility in future research.
Discussion
The discussion section of the research paper details the comprehensive mosquito wing dataset compiled from 22 research projects spanning from 2008 to 2024, encompassing 10,500 specimens across 12 countries and five continents. The dataset includes various collection methods, with a predominance of female specimens (n = 9,049) identified through both morphological and molecular techniques. The taxonomic hierarchy developed for this dataset allows for nuanced identification, accommodating uncertainties in species classification, particularly for morphologically similar species pairs and complexes.
Wing preparation involved meticulous techniques to ensure long-term preservation, with a total of 18,104 images captured using diverse imaging equipment. The dataset is publicly accessible via the Bioimage Archive, organized hierarchically by taxonomic level, and includes comprehensive metadata for each image. The validation of the dataset is supported by previous studies demonstrating the utility of wing images for species identification and population analysis through geometric morphometrics and machine learning applications. However, users should note limitations such as incomplete metadata and variability in image capture conditions, which may affect data consistency. The authors encourage contributions to further enrich this dataset as additional mosquito images are collected.
