التقييم السريري للكشف عن بصمة الإيبي باستخدام تسلسل القراءة الطويلة في الاضطرابات التنموية
Clinical evaluation of long-read sequencing-based episignature detection in developmental disorders

المجلة: Genome Medicine، المجلد: 17، العدد: 1
DOI: https://doi.org/10.1186/s13073-024-01419-z
PMID: https://pubmed.ncbi.nlm.nih.gov/39789644
تاريخ النشر: 2025-01-09
المؤلف: Mathilde Geysens وآخرون
الموضوع الرئيسي: علم الجينوم والأمراض النادرة

نظرة عامة

تبحث الدراسة في إمكانية تسلسل الجينوم الكامل طويل القراءة (lrWGS) لاكتشاف التغيرات الميثيلية الخاصة بالأمراض على مستوى الجينوم، والمعروفة باسم الإبيساينتشر، في الاضطرابات التنموية (DD). شملت الدراسة تسلسل الجينوم الكامل باستخدام تقنية النانو بورا لـ 40 ضابطًا و20 مريضًا تم تأكيد أو الاشتباه في ارتباطهم بالإبيساينتشر، تغطي 13 مرضًا متميزًا. كشفت النتائج أن أنماط الميثيلوم المستمدة من تسلسل النانو بورا كانت متسقة مع تلك التي تم الحصول عليها من الإبيساينتشر المعتمدة على الميكروأري. نجح مصنف آلة الدعم الناقل (SVM) في تحديد الإبيساينتشر في 17 من أصل 19 مريضًا لديهم متغيرات محتملة مسببة للأمراض، بينما لم يتم الكشف عن أي إبيساينتشر في الضوابط.

تخلص الدراسة إلى أن lrWGS يسهل الكشف المتزامن عن المتغيرات الجينومية وأنماط الميثيل، مما يبسط عملية التشخيص للاضطرابات التنموية. تقترح أن هذه الطريقة يمكن أن تكون اختبارًا تشخيصيًا من الدرجة الأولى في المستقبل، نظرًا لقدرتها على الكشف عن كل من الإبيساينتشر المعروفة والجديدة، بالإضافة إلى التغيرات الميثيلية الثانوية. يؤكد المؤلفون أن المزيد من الاستكشاف للجينوم قد يعزز فهم المتغيرات الجينومية، وخاصة غير المشفرة، ويوفر رؤى حول الآليات الجزيئية التي تكمن وراء الاضطرابات التنموية. بالإضافة إلى ذلك، يبرز تحديد المتغيرات الميثيلية الأولية الجديدة في المرضى الذين يعانون من اضطرابات تنموية غير مفسرة الإمكانية لـ lrWGS لمعالجة الحالات غير المحلولة في هذا المجال.

مقدمة

تسلط المقدمة الضوء على الدور الحاسم للجينوم في تنظيم التعبير الجيني وارتباطه بكل من العمليات التكيفية والمرضية، خاصة في الاضطرابات التنموية (DD). تشير إلى أن التغيرات الجينية، مثل تغييرات الميثيل المرتبطة بتوسع التكرارات وعيوب الطباعة، تساهم في القضايا التنموية. حددت الدراسات الحديثة تغيرات جينية نادرة في 23% من المرضى الذين يعانون من اضطرابات تنموية غير مفسرة، مما يبرز الحاجة إلى تحليلات جينية روتينية في التشخيص. ظهر مفهوم الإبيساينتشر – اضطرابات ميثيلية متعددة المواقع، خاصة بالاضطرابات – مع أكثر من 60 مرضًا يتميز بأنماط ميثيلية قابلة للتعرف. تحمل هذه التوقيعات إمكانيات تشخيصية كبيرة، خاصة للمتغيرات ذات الأهمية غير المعروفة (VUS).

تناقش هذه الفقرة أيضًا المعيار الحالي لتحديد الإبيساينتشر من خلال تحويل البيسلفيت وتحليل الميكروأري، والذي، على الرغم من فعاليته، يقدم تأخيرات وتكاليف في عملية التشخيص. يقدم ظهور تقنيات تسلسل طويل القراءة، مثل النانو بورا وتسلسل الجزيئات الفردية في الوقت الحقيقي، بديلاً واعدًا من خلال تمكين الكشف عن المتغيرات النوكليوتيدية الفردية (SNVs) والمتغيرات الهيكلية (SVs) وتغييرات الميثيل من الحمض النووي الأصلي دون تحيزات تضخيم. أجرى المؤلفون تسلسل الجينوم الكامل طويل القراءة باستخدام النانو بورا (lrWGS) على 20 مريضًا معروفين بالإبيساينتشر و40 ضابطًا، مما يظهر عدم تفوق الطريقة في الكشف عن الإبيساينتشر بينما تحدد في الوقت نفسه المتغيرات المسببة للأمراض الأساسية. تؤكد هذه الدراسة على إمكانية lrWGS في تعزيز عملية التشخيص للأمراض النادرة من خلال تسهيل التحليل المتزامن لكل من الجينوم والجينوم.

الطرق

توضح فقرة “الطرق” تصميم التجربة والتقنيات التحليلية المستخدمة في الدراسة. استخدم الباحثون نهجًا كميًا، حيث تم استخدام التحليلات الإحصائية لتقييم البيانات التي تم جمعها من تجارب مختلفة. شملت المنهجيات المحددة تجارب محكومة، حيث تم التلاعب بالمتغيرات بشكل منهجي لمراقبة آثارها على النتائج ذات الصلة.

شملت جمع البيانات استخدام أدوات موحدة لضمان الموثوقية والصلاحية. تم إجراء التحليل باستخدام أدوات برمجية قادرة على إجراء اختبارات إحصائية معقدة، مثل تحليل الانحدار وANOVA، لتحديد دلالة النتائج. تؤكد الفقرة على البروتوكولات الصارمة المتبعة لتقليل التحيز وتعزيز إمكانية تكرار النتائج، مما يضمن أن الاستنتاجات المستخلصة قوية وصحيحة علميًا.

النتائج

تقدم فقرة “النتائج” من ورقة البحث النتائج الرئيسية المستمدة من التجارب أو التحليلات التي تم إجراؤها. عادةً ما تشمل بيانات كمية، وتحليلات إحصائية، وتمثيلات بصرية مثل الرسوم البيانية أو الجداول لتوضيح النتائج. غالبًا ما تتم مقارنة النتائج مع الفرضيات أو الدراسات السابقة لتسليط الضوء على الفروقات أو التأكيدات المهمة.

في هذه الفقرة، قد يبلغ المؤلفون عن مقاييس محددة، مثل القيم المتوسطة، والانحرافات المعيارية، وقيم p، لدعم ادعاءاتهم. بالإضافة إلى ذلك، يتم مناقشة أي اتجاهات أو أنماط ملحوظة في البيانات، مما يوفر رؤى حول تداعيات النتائج في السياق الأوسع لمجال البحث. بشكل عام، تخدم هذه الفقرة لنقل الأدلة التجريبية التي تدعم استنتاجات الدراسة.

المناقشة

شملت الدراسة مجموعة من 20 مريضًا تم تأكيد أو الاشتباه في إصابتهم باضطرابات تنموية (DD) و40 ضابطًا صحيًا، تم تجنيدهم لتقييم الإبيساينتشر من خلال تسلسل طويل القراءة (lrWGS). تضمنت المرحلة الأولى 11 مريضًا يعانون من متلازمات مختلفة، بينما وسعت المرحلة الثانية المجموعة إلى 20 مريضًا و35 ضابطًا. تم تحديد المتغيرات الجينومية باستخدام تقنيات الميكروأري والتسلسل. استخدم التحليل تعديلًا في استدعاء القاعدة والمحاذاة لاستخراج بيانات الميثيل، مما أدى إلى تحديد مناطق ميثيلية مختلفة مرتبطة بالطباعة وتفعيل X. أظهرت الدراسة إمكانية lrWGS للكشف المتزامن عن الإبيساينتشر، والمتغيرات الهيكلية (SVs)، والمتغيرات النوكليوتيدية الفردية (SNVs)، مما يبرز قدرتها على تقديم رؤى جينومية شاملة.

أشارت النتائج إلى أن 17 من أصل 20 مريضًا تم تصنيفهم بشكل صحيح بواسطة مصنفات آلة الدعم الناقل (SVM) بناءً على إبيساينتشر الخاصة بهم، مع تصنيف جميع الضوابط الصحية بشكل مناسب. من الجدير بالذكر أن الدراسة كشفت أن وجود الإبيساينتشر يمكن أن يدعم مسببات المتغيرات ذات الأهمية غير المعروفة (VUS) ويعمل كعلامات حيوية للأمراض عندما لا يمكن تحديد المتغيرات الجينومية. ومع ذلك، تم ملاحظة بعض القيود، بما في ذلك عدم القدرة على الكشف عن الإبيساينتشر في بعض الحالات، والتي قد تُعزى إلى حجم العينة المحدود للبيانات المرجعية أو وجود الإبيساينتشر الفرعية. بشكل عام، تؤكد النتائج على فائدة lrWGS في تعزيز المشهد التشخيصي للاضطرابات الجينية، بينما تؤكد أيضًا على الحاجة إلى مزيد من التحقق من حساسية الإبيساينتشر وخصوصيتها.

Journal: Genome Medicine, Volume: 17, Issue: 1
DOI: https://doi.org/10.1186/s13073-024-01419-z
PMID: https://pubmed.ncbi.nlm.nih.gov/39789644
Publication Date: 2025-01-09
Author(s): Mathilde Geysens et al.
Primary Topic: Genomics and Rare Diseases

Overview

The research investigates the potential of long-read whole genome sequencing (lrWGS) to detect disease-specific genome-wide methylation changes, known as episignatures, in developmental disorders (DD). The study involved genome-wide nanopore sequencing of 40 controls and 20 patients with confirmed or suspected episignature-associated DD, covering 13 distinct diseases. The findings revealed that nanopore sequencing-derived methylome patterns were consistent with those obtained from microarray-based episignatures. A support vector machine (SVM) classifier successfully identified episignatures in 17 out of 19 patients with likely pathogenic variants, while no episignatures were detected in controls.

The study concludes that lrWGS facilitates the simultaneous detection of genomic variants and methylation patterns, streamlining the diagnostic process for DD. It suggests that this approach could serve as a first-tier diagnostic test in the future, given its ability to uncover both known and novel episignatures, as well as secondary epivariation. The authors emphasize that further exploration of the epigenome may enhance understanding of genomic variants, particularly non-coding ones, and provide insights into the molecular mechanisms underlying DD. Additionally, the identification of de novo primary epivariants in patients with unexplained DD highlights the potential for lrWGS to address unresolved cases in this field.

Introduction

The introduction highlights the critical role of the epigenome in regulating gene expression and its involvement in both adaptive and pathological processes, particularly in developmental disorders (DD). It notes that epigenetic variations, such as promoter methylation changes associated with repeat expansions and imprinting defects, contribute to developmental issues. Recent studies have identified rare epigenetic changes in 23% of patients with unexplained DD, emphasizing the need for routine epigenomic analyses in diagnostics. The concept of episignatures—multiloci, disorder-specific methylation disturbances—has emerged, with over 60 diseases characterized by recognizable methylation patterns. These signatures hold significant diagnostic potential, particularly for variants of unknown significance (VUS).

The section further discusses the current standard for identifying episignatures through bisulfite conversion and microarray analysis, which, while effective, introduces delays and costs in the diagnostic process. The advent of long-read sequencing technologies, such as nanopore and single molecule real-time sequencing, presents a promising alternative by enabling the detection of single nucleotide variants (SNVs), structural variants (SVs), and methylation changes from native DNA without amplification biases. The authors conducted long-read whole genome nanopore sequencing (lrWGS) on 20 patients with known episignatures and 40 controls, demonstrating the method’s non-inferiority in detecting episignatures while concurrently identifying underlying pathogenic variants. This study underscores the potential of lrWGS to enhance the diagnostic process for rare diseases by facilitating simultaneous analysis of both the genome and epigenome.

Methods

The “Methods” section outlines the experimental design and analytical techniques employed in the study. The researchers utilized a quantitative approach, employing statistical analyses to evaluate the data collected from various experiments. Specific methodologies included controlled trials, where variables were systematically manipulated to observe their effects on the outcomes of interest.

Data collection involved the use of standardized instruments to ensure reliability and validity. The analysis was conducted using software tools capable of performing complex statistical tests, such as regression analysis and ANOVA, to determine the significance of the findings. The section emphasizes the rigorous protocols followed to minimize bias and enhance the reproducibility of the results, thereby ensuring that the conclusions drawn are robust and scientifically sound.

Results

The “Results” section of the research paper presents the key findings derived from the conducted experiments or analyses. It typically includes quantitative data, statistical analyses, and visual representations such as graphs or tables to illustrate the outcomes. The results are often compared against the hypotheses or previous studies to highlight significant differences or confirmations.

In this section, the authors may report on specific metrics, such as mean values, standard deviations, and p-values, to substantiate their claims. Additionally, any observed trends or patterns in the data are discussed, providing insights into the implications of the findings within the broader context of the research field. Overall, this section serves to convey the empirical evidence that supports the study’s conclusions.

Discussion

The study involved a cohort of 20 patients with confirmed or suspected developmental disorders (DD) and 40 healthy controls, recruited to evaluate episignatures through long-read sequencing (lrWGS). The first phase included 11 patients with various syndromes, while the second phase expanded the cohort to 20 patients and 35 controls. Genomic variants were identified using chromosomal microarray and sequencing techniques. The analysis utilized modified basecalling and alignment to extract methylation data, leading to the identification of differentially methylated regions associated with imprinting and X-inactivation. The study demonstrated the potential of lrWGS for concurrent detection of episignatures, structural variants (SVs), and single nucleotide variants (SNVs), highlighting its capability to provide comprehensive genomic insights.

The results indicated that 17 out of 20 patients were correctly classified by support vector machine (SVM) classifiers based on their episignatures, with all healthy controls classified appropriately. Notably, the study revealed that the presence of episignatures could support the pathogenicity of variants of uncertain significance (VUS) and serve as biomarkers for diseases when genomic variants are not identifiable. However, limitations were noted, including the inability to detect episignatures in some cases, which may be attributed to the reference data’s limited sample size or the presence of sub-episignatures. Overall, the findings underscore the utility of lrWGS in enhancing the diagnostic landscape for genetic disorders, while also emphasizing the need for further validation of episignature sensitivity and specificity.