DOI: https://doi.org/10.1038/s41586-025-10093-z
PMID: https://pubmed.ncbi.nlm.nih.gov/41639451
تاريخ النشر: 2026-02-04
المؤلف: Lucía Barbadilla-Martínez وآخرون
الموضوع الرئيسي: علم الجينوم وديناميات الكروماتين
طرق
قسم “الطرق” يوضح التصميم التجريبي والتقنيات التحليلية المستخدمة في الدراسة. استخدم الباحثون مزيجًا من الأساليب الكمية والنوعية لجمع البيانات، مما يضمن تحليلًا شاملاً لسؤال البحث. على وجه التحديد، قاموا بتنفيذ طرق إحصائية لتقييم أهمية نتائجهم، مستخدمين اختبارات مثل اختبارات t وANOVA حيثما كان ذلك مناسبًا.
شمل جمع البيانات عملية أخذ عينات منهجية، مما يضمن أن حجم العينة كان كافيًا لدعم استنتاجات قوية. كما استخدم الباحثون تدابير تحكم للتخفيف من التحيزات المحتملة والمتغيرات المربكة. بالإضافة إلى ذلك، تم استخدام أدوات حسابية متقدمة لتحليل البيانات، مما سمح بنمذجة العلاقات المعقدة داخل مجموعة البيانات. بشكل عام، أسست الإطار المنهجي أساسًا قويًا لصحة وموثوقية نتائج الدراسة.
نقاش
في هذا القسم، يناقش المؤلفون تطوير والتحقق من صحة نموذج التعلم العميق، PARM، المصمم للتنبؤ بنشاط المحفزات بناءً على بيانات التسلسل من اختبار المراسل المتوازي الضخم (MPRA). تم تدريب النموذج على حوالي 10 ملايين قطعة من الحمض النووي الجيني تتداخل مع 30,607 محفز بشري منسق، باستخدام بيانات من خطوط خلايا K562 وHepG2. أظهرت بنية الشبكة العصبية التلافيفية دقة تنبؤية عالية، حيث حققت معاملات ارتباط بيرسون تبلغ 0.92 لـ K562 و0.89 لـ HepG2 عند التحقق من صحة المحفزات المحفوظة. علاوة على ذلك، تنبأ PARM بفعالية نشاط كل من المحفزات الطبيعية والصناعية، مما يدل على قدرته على تحديد العناصر التسلسلية الحرجة التي تؤثر على وظيفة المحفز.
استكشف المؤلفون أيضًا إمكانية PARM في توليد محفزات صناعية من خلال خوارزمية جينية، والتي قامت بتغيير التسلسلات بشكل متكرر لتعزيز النشاط المتوقع. أظهرت المحفزات الصناعية أنشطة قابلة للمقارنة مع أقوى المحفزات الطبيعية، ونجح PARM في تحديد أنماط عوامل النسخ (TF) الوظيفية المرتبطة بالمواقع التنظيمية (RSs) عبر أنواع مختلفة من الخلايا. من الجدير بالذكر أن النموذج كشف عن آليات تنظيمية محددة لنوع الخلية وقدرته على التنبؤ بالاستجابات للمؤثرات، مثل صدمة الحرارة وعلاج الأدوية، مما يوضح فائدته في تحليل المناظر التنظيمية المعقدة في المحفزات البشرية. بشكل عام، يمثل PARM تقدمًا كبيرًا في فهم نشاط المحفزات والتفاعلات التنظيمية، مع تداعيات على البيولوجيا التركيبية والتطبيقات العلاجية.
DOI: https://doi.org/10.1038/s41586-025-10093-z
PMID: https://pubmed.ncbi.nlm.nih.gov/41639451
Publication Date: 2026-02-04
Author(s): Lucía Barbadilla-Martínez et al.
Primary Topic: Genomics and Chromatin Dynamics
Methods
The “Methods” section outlines the experimental design and analytical techniques employed in the study. The researchers utilized a combination of quantitative and qualitative approaches to gather data, ensuring a comprehensive analysis of the research question. Specifically, they implemented statistical methods to evaluate the significance of their findings, employing tests such as t-tests and ANOVA where appropriate.
Data collection involved a systematic sampling process, ensuring that the sample size was adequate to support robust conclusions. The researchers also employed control measures to mitigate potential biases and confounding variables. Additionally, advanced computational tools were utilized for data analysis, allowing for the modeling of complex relationships within the dataset. Overall, the methodological framework established a solid foundation for the validity and reliability of the study’s results.
Discussion
In this section, the authors discuss the development and validation of a deep-learning model, PARM, designed to predict promoter activity based on sequence data from a massively parallel reporter assay (MPRA). The model was trained on approximately 10 million genomic DNA fragments overlapping with 30,607 curated human promoters, using data from K562 and HepG2 cell lines. The convolutional neural network architecture demonstrated high predictive accuracy, achieving Pearson’s correlation coefficients of 0.92 for K562 and 0.89 for HepG2 when validating against held-out promoters. Furthermore, PARM effectively predicted the activity of both natural and synthetic promoters, indicating its capability to identify critical sequence elements influencing promoter function.
The authors also explored the potential of PARM for generating synthetic promoters through a genetic algorithm, which iteratively mutagenized sequences to enhance predicted activity. The synthetic promoters exhibited activities comparable to the strongest natural promoters, and PARM successfully identified functional transcription factor (TF) motifs associated with regulatory sites (RSs) across various cell types. Notably, the model revealed cell-type-specific regulatory mechanisms and the ability to predict responses to stimuli, such as heat shock and drug treatment, demonstrating its utility in dissecting complex regulatory landscapes in human promoters. Overall, PARM represents a significant advancement in understanding promoter activity and regulatory interactions, with implications for synthetic biology and therapeutic applications.
