توصيف بصمات الميكروبيوتا في سلالات الخنازير الإيبيرية باستخدام خوارزميات التعلم الآلي
Characterization of microbiota signatures in Iberian pig strains using machine learning algorithms

المجلة: Animal Microbiome، المجلد: 7، العدد: 1
DOI: https://doi.org/10.1186/s42523-025-00378-z
PMID: https://pubmed.ncbi.nlm.nih.gov/39901297
تاريخ النشر: 2025-02-03
المؤلف: Lamiae Azouggagh وآخرون
الموضوع الرئيسي: دراسات سلوك الحيوان ورفاهيته

نظرة عامة

تدرس هذه الدراسة ميكروبيوم الأمعاء لسلالتين من الخنازير الإيبيرية، Entrepelado و Retinto، بالإضافة إلى تقاطعاتها المتبادلة، لفهم تأثير التباين الجيني على تركيب الميكروبيوم وآثاره على صفات جودة اللحم. باستخدام تسعة خوارزميات تعلم آلي (ML)، بما في ذلك CatBoost (CB) وSupport Vector Machine (SVM)، تحدد الدراسة الأنواع الميكروبية الرئيسية التي تميز هذه الخلفيات الجينية. كشفت التحليلات عن تباين تركيبي كبير في ميكروبيوم الأمعاء تأثر بالعوامل الجينية والعمر والدفعة، مع تحقيق أفضل أداء تصنيفي من خلال التأثيرات الأبوية، حيث بلغ متوسط منطقة تحت منحنى ROC (AUROC) 0.74 لـ CB و0.83 لـ SVM في تمييز السلالتين.

تؤكد النتائج على أهمية الخلفية الجينية في تشكيل ملف الميكروبيوم للخنازير الإيبيرية، مع ظهور أجناس ملحوظة مثل Acetitomaculum وButyricicoccus وLimosilactobacillus تظهر وفرة متفاوتة مرتبطة بإنتاج الأحماض الدهنية قصيرة السلسلة واستقلاب الدهون. تشير هذه النتائج إلى أن التباينات في التركيب الميكروبي قد تسهم في الاختلافات في الصفات المتعلقة بالدهون بين المجموعات الجينية الإيبيرية. تسلط الدراسة الضوء على إمكانيات نماذج ML في تصنيف المجموعات الجينية بناءً على بيانات الميكروبيوم وتدعو إلى مزيد من البحث لاستكشاف العلاقة بين الأنواع الميكروبية المحددة وصفات جودة اللحم المحددة.

مقدمة

تسلط مقدمة هذه الورقة البحثية الضوء على الدور المهم لميكروبيوم الأمعاء في التأثير على الصفات الظاهرية في الماشية، لا سيما فيما يتعلق بانبعاثات الميثان، وتخزين الدهون، وأداء النمو عبر أنواع مختلفة، بما في ذلك الخنازير. أشارت الدراسات الأخيرة إلى أن جينات المضيف يمكن أن تشكل تركيب الميكروبات المعوية، مع نتائج محددة تظهر وجود علاقة بين وفرة البكتيريا وكفاءة التغذية في الخنازير. تعتبر سلالة الخنازير الإيبيرية، المعروفة بلحمها عالي الجودة الذي يتميز بارتفاع الدهون داخل العضلات وبروفايل فريد من الأحماض الدهنية، نقطة التركيز في هذه الدراسة. تؤكد الورقة على التنوع الجيني بين خمس سلالات إيبيرية معترف بها وخصائصها الإنتاجية المتنوعة، لا سيما جودة اللحم الفائقة لسلالة Retinto مقارنة بسلالة Entrepelado.

على الرغم من التأثير المثبت للميكروبيوم على هذه الصفات، لم يتم إجراء تحليل مقارن لتركيب الميكروبات المعوية عبر سلالات الخنازير الإيبيرية المختلفة. تهدف الدراسة إلى سد هذه الفجوة من خلال استكشاف ميكروبيوم الأمعاء لسلالتي Entrepelado وRetinto وتقاطعاتها المتبادلة. باستخدام تسعة نماذج تعلم آلي لتحليل بيانات الميكروبيوم المستمدة من تسلسل 16S rRNA، تسعى الدراسة إلى تحديد الأنواع الميكروبية الرئيسية التي تميز هذه الخلفيات الجينية. بالإضافة إلى ذلك، ستقوم الدراسة بتقييم القوة التنبؤية لهذه الأنواع وتقديم تفسيرات بيولوجية لأهميتها بالنسبة لصفات المضيف، مما يساهم في فهم العلامات الميكروبية في صناعة الخنازير الإيبيرية.

طرق

توضح قسم “الطرق” الإجراءات التجريبية والتحليلية المستخدمة في الدراسة. يتناول اختيار المشاركين، وتصميم التجارب، والتقنيات المحددة المستخدمة لجمع البيانات وتحليلها. استخدمت الدراسة نهجًا كميًا، مع استخدام طرق إحصائية لتقييم النتائج. تم تحديد الأدوات والمقاييس الرئيسية لضمان موثوقية وValidity النتائج.

بالإضافة إلى ذلك، يصف القسم النماذج الرياضية المطبقة لتفسير البيانات، بما في ذلك أي معادلات أو خوارزميات ذات صلة. تم تصميم المنهجية لمعالجة أسئلة البحث بفعالية، مما يضمن إمكانية تعميم النتائج على مجموعة سكانية أوسع. بشكل عام، كانت الطرق المستخدمة صارمة ومنهجية، مما يوفر أساسًا قويًا لاستنتاجات الدراسة.

نتائج

كشفت تحليل تنوع الميكروبات عبر مجموعات جينية مختلفة عن تركيبات ميكروبية متميزة، مما دفع إلى تقييم أداء التصنيف باستخدام تسعة نماذج تعلم آلي (ML). برز مصنف Catboost (CB) كنموذج الأكثر فعالية في تمييز المجموعات الجينية الأربعة (الأنواع النقية EE وRR، وتقاطعاتها المتبادلة ER وRE)، محققًا منطقة تحت منحنى منحنى التشغيل (AUROC) قدرها 0.64 (95% C.I. [0.63، 0.64]). أشارت مصفوفات الالتباس إلى أن الأفراد النقيين تم تصنيفهم بدقة، بينما تم التعرف على الأفراد المتقاطعين بشكل خاطئ في كثير من الأحيان على أنهم نقيون. في تحليل مركز، حقق سيناريو التصنيف النقي AUROC محسّنًا قدره 0.77 (95% C.I. [0.76، 0.78]) باستخدام نفس نموذج CB.

شملت جهود التصنيف الإضافية سيناريوهات أمومية وأبوية، حيث حقق مصنف XGB AUROC قدره 0.66 (95% C.I. [0.65، 0.66]) للتأثيرات الأمومية، بينما حقق مصنف Catboost AUROC قدره 0.68 (95% C.I. [0.67، 0.69]) للتأثيرات الأبوية. في سيناريو الهتيروز، الذي يهدف إلى التمييز بين الأفراد في مجموعة EE-RR وأولئك في مجموعة ER-RE، كان أداء التصنيف أقل بشكل ملحوظ، حيث بلغ أفضل AUROC 0.58 (95% C.I. [0.57، 0.59])، مرة أخرى باستخدام مصنف Catboost. تسلط هذه النتائج الضوء على فعالية نماذج ML المتفاوتة في تصنيف الأفراد بناءً على العوامل الجينية والميكروبية.

مناقشة

تحققت الدراسة من تركيب ميكروبيوم الأمعاء للخنازير الإيبيرية من سلالتين نقيتين (Retinto وEntrepelado) وتقاطعاتها المتبادلة، مع التركيز على تأثير الخلفية الجينية والعمر والعوامل البيئية على تنوع الميكروبات. تم تحليل ما مجموعه 237 ذكرًا مُخصيًا، مع جمع عينات برازية وخضوعها لتسلسل جين 16S rRNA. كشفت النتائج أن Firmicutes كانت الفصيلة السائدة (93.9% وفرة نسبية)، تليها Bacteroidota (4.5%). بشكل ملحوظ، برز Streptococcus كأكثر الأجناس وفرة عبر جميع المجموعات الجينية. بينما أظهرت مقاييس تنوع ألفا عدم وجود اختلافات كبيرة بين السلالات الجينية، أشار تحليل تنوع بيتا إلى اختلافات تركيبية كبيرة، مما يشير إلى أنه على الرغم من أن تنوع المجتمع الميكروبي كان مشابهًا، إلا أن ملفات الوفرة اختلفت بشكل كبير عبر الخلفيات الجينية.

تم استخدام نماذج تعلم الآلة لتصنيف الخنازير بناءً على ميكروبيومها، محققة أداءً مرضيًا، لا سيما في تمييز الحيوانات النقية عن المتقاطعة. تحسنت أفضل درجات AUROC من 0.77 إلى 0.83 بعد اختيار الميزات، مما يشير إلى أن بعض الأجناس، مثل Acetitomaculum وButyricicoccus، كانت مهمة باستمرار عبر السيناريوهات. حدد تحليل الوفرة التفاضلية 20 جنسًا مع اختلافات كبيرة بين المجموعات الجينية، مما يعزز الفرضية بأن تركيب الميكروبيوم قد يعكس التأثيرات الجينية والبيئية. بشكل عام، تؤكد النتائج على التفاعل المعقد بين الجينات والعمر والميكروبيوم في تشكيل المشهد الميكروبي المعوي للخنازير الإيبيرية، مع آثار على ممارسات التربية والإدارة في الماشية.

Journal: Animal Microbiome, Volume: 7, Issue: 1
DOI: https://doi.org/10.1186/s42523-025-00378-z
PMID: https://pubmed.ncbi.nlm.nih.gov/39901297
Publication Date: 2025-02-03
Author(s): Lamiae Azouggagh et al.
Primary Topic: Animal Behavior and Welfare Studies

Overview

This study investigates the gut microbiota of two Iberian pig strains, Entrepelado and Retinto, along with their reciprocal crosses, to understand the influence of genetic variation on microbiome composition and its implications for meat quality traits. Utilizing nine machine learning (ML) algorithms, including CatBoost (CB) and Support Vector Machine (SVM), the research identifies key microbial taxa that differentiate these genetic backgrounds. The analysis revealed significant compositional divergence in gut microbiota influenced by genetic, age, and batch factors, with the best classification performance achieved through paternal effects, yielding a mean Area Under the ROC curve (AUROC) of 0.74 for CB and 0.83 for SVM in distinguishing the two strains.

The findings underscore the importance of genetic background in shaping the microbiota profile of Iberian pigs, with notable genera such as Acetitomaculum, Butyricicoccus, and Limosilactobacillus showing differential abundance linked to short-chain fatty acid production and lipid metabolism. These results suggest that variations in microbial composition may contribute to differences in fat-related traits among Iberian genetic groups. The study highlights the potential of ML models in classifying genetic groups based on microbiome data and calls for further research to explore the relationship between identified microbial taxa and specific meat quality traits.

Introduction

The introduction of this research paper highlights the significant role of the gut microbiome in influencing phenotypic traits in livestock, particularly in relation to methane emissions, fat deposition, and growth performance across various species, including pigs. Recent studies have indicated that host genetics can shape gut microbial composition, with specific findings demonstrating a correlation between bacterial abundance and feed efficiency in pigs. The Iberian pig breed, known for its high-quality meat characterized by elevated intramuscular fat and a unique fatty acid profile, serves as the focal point of this study. The paper underscores the genetic diversity among the five recognized Iberian strains and their varying productive traits, particularly the superior meat quality of the Retinto strain compared to the Entrepelado strain.

Despite the established influence of the microbiome on these traits, a comparative analysis of gut microbial composition across different Iberian pig strains has not been conducted. The study aims to fill this gap by exploring the gut microbiota of the Entrepelado and Retinto strains and their reciprocal crosses. Utilizing nine machine learning models to analyze microbiota data derived from 16S rRNA sequencing, the research seeks to identify key microbial taxa that distinguish these genetic backgrounds. Additionally, the study will assess the predictive power of these taxa and provide biological interpretations of their relevance to host phenotypes, thereby contributing to the understanding of microbial biomarkers in the Iberian pig industry.

Methods

The “Methods” section outlines the experimental and analytical procedures employed in the study. It details the selection of participants, the design of the experiments, and the specific techniques used for data collection and analysis. The study utilized a quantitative approach, employing statistical methods to evaluate the results. Key instruments and metrics were specified to ensure the reliability and validity of the findings.

Additionally, the section describes the mathematical models applied to interpret the data, including any relevant equations or algorithms. The methodology was designed to address the research questions effectively, ensuring that the results could be generalized to a broader population. Overall, the methods employed were rigorous and systematic, providing a solid foundation for the study’s conclusions.

Results

The analysis of microbial diversity across different genetic groups revealed distinct microbiota compositions, prompting an evaluation of classification performance using nine machine learning (ML) models. The Catboost classifier (CB) emerged as the most effective model for differentiating the four genetic groups (purebreds EE and RR, and their reciprocal crosses ER and RE), achieving an area under the receiver operating characteristic curve (AUROC) of 0.64 (95% C.I. [0.63, 0.64]). Confusion matrices indicated that purebred individuals were classified accurately, while crossed individuals were frequently misidentified as purebreds. In a focused analysis, the purebred classification scenario yielded an improved AUROC of 0.77 (95% C.I. [0.76, 0.78]) using the same CB model.

Further classification efforts included maternal and paternal scenarios, with the XGB classifier achieving an AUROC of 0.66 (95% C.I. [0.65, 0.66]) for maternal effects and the Catboost classifier yielding an AUROC of 0.68 (95% C.I. [0.67, 0.69]) for paternal effects. In the heterosis scenario, which aimed to distinguish between individuals in the EE-RR group and those in the ER-RE group, the classification performance was notably lower, with the best AUROC reaching only 0.58 (95% C.I. [0.57, 0.59]), again using the Catboost classifier. These results highlight the varying effectiveness of ML models in classifying individuals based on genetic and microbial factors.

Discussion

The study investigated the gut microbiota composition of Iberian pigs from two purebred strains (Retinto and Entrepelado) and their reciprocal crosses, focusing on the impact of genetic background, age, and environmental factors on microbial diversity. A total of 237 castrated males were analyzed, with fecal samples collected and subjected to 16S rRNA gene amplicon sequencing. The results revealed that Firmicutes was the predominant phylum (93.9% relative abundance), followed by Bacteroidota (4.5%). Notably, Streptococcus emerged as the most abundant genus across all genetic groups. While alpha-diversity metrics showed no significant differences among the genetic strains, beta-diversity analysis indicated significant compositional differences, suggesting that while microbial community diversity was similar, the abundance profiles varied significantly across genetic backgrounds.

Machine learning models were employed to classify the pigs based on their microbiota, achieving satisfactory performance, particularly in distinguishing purebred from crossbred animals. The best AUROC scores improved from 0.77 to 0.83 after feature selection, indicating that certain genera, such as Acetitomaculum and Butyricicoccus, were consistently important across scenarios. Differential abundance analysis identified 20 genera with significant differences between genetic groups, reinforcing the hypothesis that microbiota composition may reflect genetic and environmental influences. Overall, the findings underscore the complex interplay between genetics, age, and microbiota in shaping the gut microbial landscape of Iberian pigs, with implications for breeding and management practices in livestock.