DOI: https://doi.org/10.1093/molbev/msaf172
PMID: https://pubmed.ncbi.nlm.nih.gov/40668947
تاريخ النشر: 2025-07-16
المؤلف: Chao Zhang وآخرون
الموضوع الرئيسي: دراسات الجينوميات والتطور
نظرة عامة
تقدم هذه القسم نظرة عامة على تطوير حزمة شاملة تُدعى ASTER، والتي تدمج طرقًا مختلفة مشابهة لـ ASTRAL لاستنتاج شجرة الأنواع تأخذ في الاعتبار عدم توافق شجرة الجينات. تشمل حزمة ASTER عدة أدوات متخصصة مصممة لأنواع مختلفة من بيانات الإدخال: ASTRAL لتوبولوجيات شجرة الجينات ذات النسخة الواحدة، ASTRAL الموزونة (wASTRAL) لشجرات الجينات ذات النسخة الواحدة مع أطوال الفروع و/أو قيم الدعم، ASTRAL-Pro لتوبولوجيات شجرة الجينات متعددة النسخ، CASTER لمحاذاة التسلسلات المتعددة (بما في ذلك محاذاة الجينوم)، و WASTER لبيانات القراءة القصيرة والجينومات المجمعة.
تهدف مقدمة ASTER إلى تعزيز قابلية التوسع والدقة والمرونة في استنتاج شجرة الأنواع، مما يوفر للباحثين إطارًا قويًا لتحليل العلاقات التطورية عبر مجموعات بيانات جينومية متنوعة. تسهل هذه التكامل للأدوات نهجًا أكثر شمولاً لفهم تطور الأنواع من خلال استيعاب أنواع البيانات المختلفة والتعقيدات المتأصلة في الدراسات الجينومية.
مناقشة
تقدم مجموعة ASTER (مُقدّر شجرة الأنواع الدقيقة) مجموعة موحدة من أدوات استنتاج شجرة الأنواع، مما يعزز قابلية التوسع والكفاءة مقارنة بالتطبيقات السابقة. يقوم الخوارزم الأساسي، الذي طوره زانغ وميراراب (2022b)، بتحسين البحث عن شجرات كلاد غير متجذرة من خلال تعظيم الدرجات عبر شجرات الرباعيات المستحثة دون الحاجة إلى تسجيل الرباعيات بشكل صريح. تتضمن ASTER سلسلة من التقدمات المنهجية، بما في ذلك استنتاج شجرة أولية جشعة، وتحركات التبادل الأقرب (NNI)، واستراتيجية التقسيم والتغلب، والتي تحسن الأداء بشكل جماعي مع زيادة عدد الجينات والبيانات المفقودة.
من بين الأدوات المدرجة في ASTER، تبرز ASTRAL-IV لقدرتها على التوسع الخطي مع عدد الجينات، متفوقة بشكل كبير على سابقتها ASTRAL-III من حيث السرعة والتعامل مع البيانات المفقودة. بالإضافة إلى ذلك، تقدم wASTRAL بديلاً قويًا من خلال وزن شجرات الجينات بناءً على أطوال الفروع وقيم الدعم، مما يعزز الدقة في وجود عدم اليقين. أدوات أخرى، مثل ASTRAL-Pro-3 و CASTER، توسع القدرات لتشمل الجينات متعددة النسخ والاستنتاج المباشر من محاذاة التسلسلات المتعددة، على التوالي، حيث تُظهر CASTER كفاءة ودقة ملحوظة في مجموعات البيانات الجينومية الكبيرة. على الرغم من هذه التقدمات، لا يزال هناك قيد ملحوظ: لا تُنمذج أي من الأدوات الحالية تدفق الجينات والتزاوج، وهو ما يمكن معالجته في الإصدارات المستقبلية من ASTER. يهدف التطوير المستمر لخوارزميات جديدة، مثل SISTER، إلى دمج أنواع بيانات إضافية، مما يوسع بشكل أكبر من قابلية تطبيق المجموعة وفعاليتها في التحليل التطوري.
DOI: https://doi.org/10.1093/molbev/msaf172
PMID: https://pubmed.ncbi.nlm.nih.gov/40668947
Publication Date: 2025-07-16
Author(s): Chao Zhang et al.
Primary Topic: Genomics and Phylogenetic Studies
Overview
The section provides an overview of the development of a comprehensive package named ASTER, which integrates various ASTRAL-like methods for species tree inference that account for gene tree discordance. The ASTER package includes several specialized tools tailored for different types of input data: ASTRAL for single-copy gene tree topologies, weighted ASTRAL (wASTRAL) for single-copy gene trees with branch lengths and/or support values, ASTRAL-Pro for multi-copy gene tree topologies, CASTER for multiple sequence alignments (including genome alignments), and WASTER for short-read data and assembled genomes.
The introduction of ASTER aims to enhance the scalability, accuracy, and versatility of species tree inference, thereby providing researchers with a robust framework to analyze phylogenetic relationships across diverse genomic datasets. This integration of tools facilitates a more comprehensive approach to understanding species evolution by accommodating various data types and complexities inherent in genomic studies.
Discussion
The ASTER (Accurate Species Tree EstimatoR) suite introduces a consolidated set of species tree inference tools, enhancing scalability and efficiency compared to previous implementations. The core algorithm, developed by Zhang and Mirarab (2022b), optimizes the search for unrooted cladograms by maximizing scores across induced quartet trees without the need for explicit quartet scoring. ASTER incorporates a series of methodological advancements, including a greedy initial tree inference, nearest-neighbor interchange (NNI) moves, and a divide-and-conquer strategy, which collectively improve performance with increasing gene numbers and missing data.
Among the tools included in ASTER, ASTRAL-IV stands out for its linear scalability with the number of genes, significantly outperforming its predecessor ASTRAL-III in both speed and handling of missing data. Additionally, wASTRAL offers a robust alternative by weighting gene trees based on branch lengths and support values, enhancing accuracy in the presence of uncertainty. Other tools, such as ASTRAL-Pro-3 and CASTER, extend capabilities to multi-copy genes and direct inference from multiple sequence alignments, respectively, with CASTER demonstrating remarkable efficiency and accuracy in large genomic datasets. Despite these advancements, a notable limitation remains: none of the current tools model gene flow and hybridization, which could be addressed in future iterations of ASTER. The ongoing development of new algorithms, such as SISTER, aims to incorporate additional data types, further broadening the suite’s applicability and effectiveness in phylogenetic analysis.
