DOI: https://doi.org/10.3389/fgene.2025.1579848
PMID: https://pubmed.ncbi.nlm.nih.gov/40176796
تاريخ النشر: 2025-03-19
المؤلف: Zhenyun Du وآخرون
الموضوع الرئيسي: الميكروبيولوجيا الفموية وبحوث التهاب اللثة
نظرة عامة
تقدم هذه القسم نظرة عامة على التهاب اللثة، وهي مشكلة شائعة في صحة الفم تتميز بالتهاب مزمن بسبب العدوى البكتيرية، تؤثر على الأنسجة الداعمة للأسنان. يتأثر تقدم المرض بالعوامل الوراثية، والاستجابات المناعية، والتغيرات في تكوين الميكروبيوم الفموي. غالبًا ما تكون الأعراض المبكرة خفية، مما يؤدي إلى تأخير التدخل الطبي؛ وبالتالي، فإن تحديد العلامات الحيوية للتشخيص في الوقت المناسب أمر بالغ الأهمية.
تستخدم الدراسة مجموعتين من البيانات (GSE10334 و GSE16134) من قاعدة بيانات GEO، مع التركيز على بيانات التسلسل من أنسجة اللثة المتأثرة وغير المتأثرة لمرضى التهاب اللثة. لكشف النقاب عن الجينات الرئيسية المرتبطة بتسبب المرض والعلامات الحيوية العلاجية المحتملة، استخدم الباحثون غابة عشوائية لاختيار الميزات وتحليل الشبكة الجينية المشتركة الموزونة (WGCNA) لتحديد وحدات الجينات المشتركة التعبير. تهدف التحليل الشامل إلى توضيح المسارات الجزيئية المعنية في تقدم مرض اللثة، وفي النهاية تحديد أهداف علاجية جديدة لتعزيز التدخلات السريرية. تسهم النتائج بشكل كبير في كل من التطبيقات السريرية والبحث الأساسي، مما يوفر رؤى لاستراتيجيات التشخيص المبكر وإطار نظري للدراسات المستقبلية حول الآليات الجزيئية لالتهاب اللثة.
مقدمة
تتناول مقدمة ورقة البحث القضية الصحية العالمية الهامة المتعلقة بالتهاب اللثة، وهي حالة مزمنة مدفوعة أساسًا بالنشاط الميكروبي الذي يؤدي إلى تدهور نظام الدعم اللثوي، بما في ذلك اللثة والعظام الفكية. هذه الحالة، التي تنتشر بشكل خاص بين البالغين، تظهر زيادة ملحوظة في الحدوث مع تقدم العمر، حيث تؤثر على أكثر من 1 مليار فرد في جميع أنحاء العالم اعتبارًا من عام 2021، مع توقعات تشير إلى ارتفاع العدد إلى أكثر من 1.5 مليار حالة بحلول عام 2050 (Nascimento et al., 2024). يُعزى التفاوت بين الجنسين في الانتشار، حيث يتأثر الرجال أكثر من النساء، إلى عوامل مثل استخدام التبغ وتباين ممارسات العناية بالأسنان (Del Pinto et al., 2024).
يتأثر تقدم التهاب اللثة بتفاعل معقد من الاستعداد الوراثي، واضطراب الاستجابة المناعية، والاختلال الميكروبي، مما يمكن أن يؤدي إلى تفاقم الالتهاب وتدمير الأنسجة اللثوية بشكل شديد وفقدان الأسنان (Teles et al., 2022). يمكن أن تؤدي الأعراض المبكرة، التي غالبًا ما تُخطأ على أنها مشاكل عامة في اللثة، إلى تأخير العلاج، مما يؤدي إلى مراحل متقدمة يصعب إدارتها. تُظهر التطورات الحديثة في العلاج، بما في ذلك العلاجات بالليزر والمضادات الميكروبية، وعدًا ولكن تأتي مع مخاطر مثل التكاليف العالية ومقاومة الأدوية المحتملة. تهدف الدراسة إلى تحديد الجينات الرئيسية المرتبطة بالتهاب اللثة من خلال دمج بيانات المصفوفات الدقيقة والخوارزميات المتقدمة، مما يعزز استراتيجيات التشخيص والعلاج المبكر.
طرق
في هذه الدراسة، تم الحصول على بيانات الجينوم من مستودع تعبير الجينات (GEO)، مع التركيز على مجموعتين من البيانات: GSE10334 و GSE16134، والتي تم تصنيفها إلى مجموعات متأثرة وغير متأثرة بالتهاب اللثة. تم إجراء معالجة البيانات والتحليلات الإحصائية باستخدام R (v4.4.0)، مع استخدام طريقة تطبيع ComBat من حزمة sva للتخفيف من تأثيرات الدفعات وضمان اتساق مجموعة البيانات. تصحيح هذا النهج البايزي بشكل فعال للاختلافات النظامية عبر الدفعات، مما سمح بإجراء تحليلات موثوقة في المراحل التالية.
تم تحديد الجينات المعبر عنها بشكل مختلف (DEGs) باستخدام حزمة limma، التي تطبق إطار عمل بايزي تجريبي على بيانات المصفوفات الدقيقة، مما يسهل الكشف القوي مع التحكم في الاختبارات المتعددة. تم إجراء التجميع الهرمي باستخدام أداة pheatmap لتصور التغيرات في التعبير. بالإضافة إلى ذلك، تم استخدام إطار عمل تحليل الشبكة الجينية المشتركة الموزونة (WGCNA) لاستكشاف علاقات التعبير المشترك بين الجينات وتحديد وحدات الجينات الوظيفية. تم فحص الجينات الرئيسية باستخدام حزمة “randomForest”، التي تقيم الأهمية النسبية للجينات بالنسبة للمرض. أخيرًا، تم إجراء تحليلات إثراء المسار باستخدام أداة clusterProfiler، مع دمج قواعد بيانات علم الأحياء الجزيئي (GO) وقاموس كيوتو لعلم الجينات والجنوم (KEGG)، مع تطبيق تصحيح معدل الاكتشاف الكاذب (FDR) لضمان الصلاحية الإحصائية. أوضح هذا النهج الشامل الآليات البيولوجية والشبكات الجزيئية المرتبطة بالجنيات المحورية المحددة.
نتائج
في هذه الدراسة، تم استخدام تحليل غابة عشوائية (RF) لتحديد الجينات الرئيسية المرتبطة بالمرض من مجموعات بيانات جينية كبيرة، مما يظهر فعاليتها في التعامل مع البيانات عالية الأبعاد والتفاعلات الجينية المعقدة. شمل التحليل دمج مجموعتين مستقلتين من البيانات في مصفوفة تمثيل جديدة، تم من خلالها اختيار 300 جين معبر عنه بشكل مرتفع و300 جين معبر عنه بشكل منخفض لمزيد من التحقيق. تم تحقيق التحقق من النموذج من خلال تقسيم عشوائي مصنف، مما أسفر عن معدل خطأ خارج الحقيبة (OOB) بنسبة 3.23% مع 24 شجرة قرار، مما يشير إلى استقرار النموذج. أدت درجات الأهمية المميزة المحسوبة عبر مؤشر جيني إلى تحديد أفضل 24 جينًا محتملًا رئيسيًا.
بعد ذلك، تم إنشاء مجموعة جينية شاملة من خلال دمج 24 DEG من تحليل RF مع 65 DEG تم تحديدها من خلال تحليل الشبكة الجينية المشتركة الموزونة (WGCNA). تم تقييم الصلة الوظيفية من خلال إثراء مصطلحات علم الأحياء الجزيئي (GO) وتحليل مسار KEGG. كشفت النتائج، الموضحة في الشكل 5، عن ارتباطات كبيرة بين DEGs وعمليات بيولوجية متنوعة، مع إثراءات ملحوظة في تطوير البشرة (عملية بيولوجية)، الجانب الخارجي من الغشاء البلازمي (مكون خلوي)، وارتباط الأكتين (وظيفة جزيئية). أبرز تحليل KEGG تفاعل السيتوكين-مستقبل السيتوكين كأهم مسار مُثرٍ، مما يبرز الأدوار التنظيمية المعقدة لهذه الجينات في العمليات الخلوية وتأثيراتها المحتملة في آليات المرض.
مناقشة
في هذه الدراسة، استخدمنا تحليل الشبكة الجينية المشتركة الموزونة (WGCNA) وخوارزميات غابة عشوائية (RF) للتحقيق في أنماط التعبير الجيني المرتبطة بالتهاب اللثة. ضمنت معالجة البيانات الدقيقة سلامة مجموعات البيانات لدينا، مما أدى إلى تحديد وحدات التعبير المشترك التي تعكس مجموعات الجينات ذات الصلة بيولوجيًا. تم تحديد ما مجموعه 65 جينًا مهمًا من خلال WGCNA، بينما كشف تحليل RF عن 24 جينًا معبرًا عنه بشكل مختلف، مع تداخل ملحوظ بين الطريقتين. من بين هذه الجينات، برز CXCL1 كجين رئيسي، معروف بدوره في الاستجابة المناعية والالتهاب، خاصة في سياق التهاب اللثة. بالإضافة إلى ذلك، تم تسليط الضوء على COL15A1 لأهميته الهيكلية في الأنسجة الضامة وتأثيراته المحتملة في أمراض متنوعة، بما في ذلك الاضطرابات القلبية الوعائية.
أوضحت تحليلات إثراء الوظائف، بما في ذلك تحليلات علم الأحياء الجزيئي (GO) وتحليلات مسار KEGG، الأدوار البيولوجية والمسارات المرتبطة بهذه الجينات، كاشفة عن مشاركتها في عمليات حاسمة مثل الاستجابة المناعية، وإصلاح الأنسجة، والالتهاب. تؤكد النتائج على إمكانية استخدام CXCL1 وCOL15A1 كعلامات حيوية لالتهاب اللثة، مما يوفر رؤى حول أدوارها في آليات المرض والأهداف العلاجية. لا يعزز هذا النهج الشامل فهمنا لتسبب التهاب اللثة فحسب، بل يضع أيضًا الأساس للبحوث المستقبلية التي تهدف إلى تطوير تدخلات مستهدفة لهذا المرض الشائع في الفم.
القيود
القيود الرئيسية لهذه الدراسة هي مجموعة البيانات الصغيرة نسبيًا، والتي قد تؤدي إلى انحرافات في النتائج. على الرغم من البحث الشامل في قاعدة بيانات GEO عن بيانات المصفوفات الدقيقة لكل من اللثة المتأثرة وغير المتأثرة لدى مرضى التهاب اللثة (PD)، إلا أن مجموعتين فقط من البيانات استوفتا معايير الإدراج. بينما تم تعويض هذه المجموعات بحجم عينة كافٍ، قد تؤثر محدودية توفر البيانات على قوة النتائج. ستسعى الأبحاث المستقبلية إلى التحقق من هذه النتائج من خلال منهجيات بديلة.
DOI: https://doi.org/10.3389/fgene.2025.1579848
PMID: https://pubmed.ncbi.nlm.nih.gov/40176796
Publication Date: 2025-03-19
Author(s): Zhenyun Du et al.
Primary Topic: Oral microbiology and periodontitis research
Overview
This section provides an overview of periodontitis, a widespread oral health issue characterized by chronic inflammation due to bacterial infection, affecting the supporting tissues of the teeth. The disease’s progression is influenced by genetic factors, immune responses, and changes in oral microbiota composition. Early symptoms are often subtle, leading to delayed medical intervention; thus, identifying biomarkers for timely diagnosis is crucial.
The study utilizes two datasets (GSE10334 and GSE16134) from the GEO database, focusing on sequencing data from affected and unaffected gum tissues of periodontitis patients. To uncover key genes linked to the disease’s pathogenesis and potential therapeutic biomarkers, the researchers employed Random Forest for feature selection and Weighted Gene Co-expression Network Analysis (WGCNA) to identify co-expressed gene modules. The comprehensive analysis aims to elucidate the molecular pathways involved in periodontal disease progression, ultimately identifying novel therapeutic targets to enhance clinical interventions. The findings contribute significantly to both clinical applications and fundamental research, offering insights for early diagnostic strategies and a theoretical framework for future studies on the molecular mechanisms of periodontitis.
Introduction
The introduction of the research paper addresses the significant global health issue of periodontal inflammation, a chronic condition primarily driven by microbial activity that leads to the deterioration of the periodontal support system, including gums and alveolar bone. This condition, particularly prevalent among adults, shows a marked increase in incidence with advancing age, affecting over 1 billion individuals worldwide as of 2021, with projections indicating a rise to over 1.5 billion cases by 2050 (Nascimento et al., 2024). The gender disparity in prevalence, with men being more affected than women, is attributed to factors such as tobacco use and variations in dental care practices (Del Pinto et al., 2024).
The progression of periodontitis is influenced by a complex interplay of genetic predisposition, immune response dysregulation, and microbial dysbiosis, which can exacerbate inflammation and lead to severe periodontal tissue destruction and tooth loss (Teles et al., 2022). Early symptoms, often mistaken for general gum issues, can delay treatment, resulting in advanced stages that are challenging to manage. Recent advancements in treatment, including laser and antimicrobial therapies, show promise but come with risks such as high costs and potential drug resistance. The study aims to identify key genes associated with periodontitis through the integration of microarray data and advanced algorithms, thereby enhancing early diagnosis and treatment strategies.
Methods
In this study, genomic data were sourced from the Gene Expression Omnibus (GEO) repository, focusing on two datasets: GSE10334 and GSE16134, which were categorized into periodontitis gingival affected and unaffected groups. Data processing and statistical analyses were conducted using R (v4.4.0), employing the ComBat normalization method from the sva package to mitigate batch effects and ensure dataset consistency. This Bayesian approach effectively corrected for systematic differences across batches, allowing for reliable downstream analyses.
Differentially expressed genes (DEGs) were identified using the limma package, which applies an empirical Bayesian framework to microarray data, facilitating robust detection while controlling for multiple testing. Hierarchical clustering was performed with the pheatmap tool to visualize transcriptional variations. Additionally, the Weighted Gene Co-expression Network Analysis (WGCNA) framework was utilized to explore inter-gene co-expression relationships and identify functional gene modules. Key genes were screened using the “randomForest” package, which assesses the relative importance of genes in relation to disease. Finally, pathway enrichment analyses were conducted with the clusterProfiler tool, incorporating Gene Ontology (GO) and Kyoto Encyclopedia of Genes and Genomes (KEGG) databases, while applying false discovery rate (FDR) correction to ensure statistical validity. This comprehensive approach elucidated the biological mechanisms and molecular networks associated with the identified pivotal genes.
Results
In this study, Random Forest (RF) analysis was employed to identify key disease-related genes from large genetic datasets, demonstrating its effectiveness in handling high-dimensional data and complex gene interactions. The analysis involved combining two independent datasets into a new representation matrix, from which the 300 most significantly upregulated and 300 downregulated differentially expressed genes (DEGs) were selected for further investigation. Model validation was achieved through stratified random partitioning, resulting in an out-of-bag (OOB) error rate of 3.23% with 24 decision trees, indicating model stability. The feature importance scores calculated via the Gini index led to the identification of the top 24 potential key genes.
Subsequently, a comprehensive gene set was created by integrating the 24 DEGs from the RF analysis with 65 DEGs identified through Weighted Gene Co-expression Network Analysis (WGCNA). Functional relevance was assessed through Gene Ontology (GO) term enrichment and KEGG pathway analysis. The results, illustrated in Figure 5, revealed significant associations between DEGs and various biological processes, with notable enrichments in epidermis development (biological process), external side of plasma membrane (cellular component), and actin binding (molecular function). The KEGG analysis highlighted cytokine-cytokine receptor interaction as the primary enriched pathway, underscoring the intricate regulatory roles of these genes in cellular processes and their potential implications in disease mechanisms.
Discussion
In this study, we employed Weighted Gene Co-expression Network Analysis (WGCNA) and Random Forest (RF) algorithms to investigate gene expression patterns associated with periodontitis. Rigorous data preprocessing ensured the integrity of our datasets, leading to the identification of co-expression modules that reflect biologically relevant gene clusters. A total of 65 significant genes were identified through WGCNA, while RF analysis revealed 24 differentially expressed genes, with notable overlap between the two methods. Among these, CXCL1 emerged as a key gene, recognized for its role in immune response and inflammation, particularly in the context of periodontitis. Additionally, COL15A1 was highlighted for its structural significance in connective tissues and potential implications in various diseases, including cardiovascular disorders.
Functional enrichment analyses, including Gene Ontology (GO) and KEGG pathway analyses, elucidated the biological roles and pathways associated with these genes, revealing their involvement in critical processes such as immune response, tissue repair, and inflammation. The findings underscore the potential of CXCL1 and COL15A1 as biomarkers for periodontitis, offering insights into their roles in disease mechanisms and therapeutic targets. This comprehensive approach not only enhances our understanding of periodontitis pathogenesis but also lays the groundwork for future research aimed at developing targeted interventions for this prevalent oral disease.
Limitations
The primary limitation of this study is the relatively small dataset, which may introduce deviations in the findings. Despite an extensive search of the GEO database for microarray data on both affected and unaffected gums in patients with periodontal disease (PD), only two datasets met the inclusion criteria. While these datasets were compensated for by a sufficient sample size, the limited availability of data may affect the robustness of the results. Future research will aim to validate these findings through alternative methodologies.
