CactEcoDB: بيانات الصفات، والبيئة، والبيانات البيئية، والبيانات النشوء والتطور، والتنوع لعائلة الصبار
CactEcoDB: Trait, spatial, environmental, phylogenetic and diversification data for the cactus family

المجلة: Scientific Data، المجلد: 13، العدد: 1
DOI: https://doi.org/10.1038/s41597-026-06936-7
PMID: https://pubmed.ncbi.nlm.nih.gov/41792150
تاريخ النشر: 2026-03-07
المؤلف: Jamie Thompson وآخرون
الموضوع الرئيسي: البحث النباتي وتطبيقاته

نظرة عامة

توضح هذه القسم ضرورة وجود مجموعات بيانات متكاملة للبحث المقارن في أنواع النباتات، مع تسليط الضوء بشكل خاص على عائلة الصبار (Cactaceae)، التي تتميز بتنوعها البيئي وارتفاع خطر انقراضها. لمعالجة نقص البيانات الشاملة لهذه المجموعة، يقدم المؤلفون CactEcoDB (قاعدة بيانات الصبار البيئية)، وهي مورد مفتوح الوصول يجمع البيانات المكانية والبيئية والسمات والنسل والتنوع لأكثر من 1,000 نوع من الصبار. تتضمن هذه القاعدة معلومات عن السمات على مستوى الأنواع، وسجلات الوجود الجغرافي، والمتغيرات البيئية، وتقديرات حجم النطاق، ومعدلات التخصص، وأكبر شجرة عائلية زمنية دقيقة للصبار متاحة حتى الآن.

يؤكد المؤلفون على أهمية مثل هذه المجموعات من البيانات لتقدم الأساليب المقارنة التي تعزز فهمنا لأصول التنوع البيولوجي ومحركاته البيئية داخل العائلات النباتية الكبيرة. يشيرون إلى أن البحث المقارن الفعال يعتمد على مجموعات بيانات تلتقط تعقيدات تطور السمات، والتغيرات البيئية، وتنوع السلالات. مع تفاقم التغيرات العالمية وزيادة عدم توازن توفر البيانات، تصبح الحاجة إلى مجموعات بيانات عالية الجودة ومتكاملة لمجموعات النباتات المهددة مثل الصبار أمرًا حاسمًا للدراسات البيئية والتطورية والبيوجغرافية والحفاظ على البيئة.

نقاش

في هذا القسم، يناقش المؤلفون المنهجيات المستخدمة لتقدير معدلات التنوع في الصبار، باستخدام ثلاثة أساليب متميزة: التحليل البايزي للخلائط الماكرو-تطورية (BAMM)، وتخصص الحالة المفقودة والانقراض (MiSSE)، وإحصائية DR. يتم تسليط الضوء على BAMM لقدرتها على حساب كسور العينة الخاصة بالسلالات وعدم اليقين في تغييرات المعدل، على الرغم من الانتقادات المتعلقة بحساسيتها للمعايير السابقة. بينما يوفر MiSSE إطار عمل يعتمد على الاحتمالية القصوى، يتم الإشارة إلى قيوده في معالجة التباين داخل المجموعة في العينة. تقدم إحصائية DR تقديرات سريعة ولكنها أقل موثوقية بسبب عدم قدرتها على حساب العينة غير المكتملة. يدعو المؤلفون إلى استخدام BAMM كطريقة مفضلة، خاصة لصلابتها في التعامل مع العينة غير المكتملة وتقديم توزيعات لاحقة للتقديرات.

كما يوضح المؤلفون تجميع بيانات السمات الشاملة الخاصة بهم، والتي تدمج معلومات على مستوى الأنواع من مصادر موثوقة متنوعة. تم توحيد وتوسيع السمات الرئيسية مثل ارتفاع النبات، وشكل النمو، ونمط التلقيح، وعدد الكروموسومات، مما أدى إلى مجموعة بيانات تعزز بشكل كبير من عينة الأنواع. يقدمون نظام تصنيف محسّن لأشكال النمو، ينتقل من نظام ثنائي إلى نظام من تسع فئات، والذي يفترضون أنه يلتقط بشكل أفضل تنوع شكل الصبار. بالإضافة إلى ذلك، قام المؤلفون بتجميع بيانات تفصيلية عن التلقيح وعدد الكروموسومات، مؤكدين على أهمية التصنيفات الدقيقة على مستوى الأنواع للتحليلات البيئية والتطورية. يختتم القسم بوصف لعمليات التحقق الدقيقة المستخدمة لضمان موثوقية البيانات ودمج المتغيرات البيئية الضرورية لفهم توزيع الصبار وبيئته.

Journal: Scientific Data, Volume: 13, Issue: 1
DOI: https://doi.org/10.1038/s41597-026-06936-7
PMID: https://pubmed.ncbi.nlm.nih.gov/41792150
Publication Date: 2026-03-07
Author(s): Jamie Thompson et al.
Primary Topic: Botanical Research and Applications

Overview

The section outlines the necessity of integrated datasets for comparative research in plant taxa, particularly highlighting the Cactaceae family, which is both ecologically diverse and at high risk of extinction. To address the scarcity of comprehensive data for this group, the authors introduce CactEcoDB (The Cactus Ecological Database), an Open Access resource that compiles spatial, ecological, trait, phylogenetic, and diversification data for over 1,000 cactus species. This database includes species-level trait information, geographic occurrence records, environmental variables, range size estimates, speciation rates, and the most extensive time-calibrated phylogeny of cacti available to date.

The authors emphasize the importance of such datasets for advancing comparative methods that enhance our understanding of biodiversity’s origins and ecological drivers within large plant families. They note that effective comparative research relies on datasets that capture the complexities of trait evolution, environmental variation, and lineage diversification. As global changes intensify and data availability becomes increasingly uneven, the need for high-quality, integrative datasets for threatened plant groups like cacti becomes critical for ecological, evolutionary, biogeographic, and conservation studies.

Discussion

In this section, the authors discuss the methodologies employed for estimating diversification rates in cacti, utilizing three distinct approaches: Bayesian Analysis of Macroevolutionary Mixtures (BAMM), Missing State Speciation and Extinction (MiSSE), and the DR statistic. BAMM is highlighted for its ability to account for lineage-specific sampling fractions and uncertainty in rate shifts, despite criticisms regarding its sensitivity to priors. MiSSE, while providing a Maximum Likelihood framework, is noted for its limitations in addressing within-group variation in sampling. The DR statistic offers rapid estimations but is less reliable due to its inability to account for incomplete sampling. The authors advocate for BAMM as the preferred method, particularly for its robustness in handling incomplete sampling and providing posterior distributions of estimates.

The authors also detail their comprehensive trait data compilation, which integrates species-level information from various authoritative sources. Key traits such as plant height, growth form, pollination syndrome, and chromosome count were standardized and expanded, resulting in a dataset that significantly enhances species sampling. They introduce a refined classification system for growth forms, moving from a binary to a nine-category system, which they hypothesize better captures the diversity of cactus morphology. Additionally, the authors compiled detailed pollination data and chromosome counts, emphasizing the importance of accurate species-level classifications for ecological and evolutionary analyses. The section concludes with a description of the rigorous validation processes employed to ensure data reliability and the integration of environmental variables crucial for understanding cactus distribution and ecology.