الكشف عن أمراض القلب الهيكلية من تخطيط القلب الكهربائي باستخدام الذكاء الاصطناعي
Detecting structural heart disease from electrocardiograms using AI

المجلة: Nature، المجلد: 644، العدد: 8075
DOI: https://doi.org/10.1038/s41586-025-09227-0
PMID: https://pubmed.ncbi.nlm.nih.gov/40670798
تاريخ النشر: 2025-07-16
المؤلف: Timothy J. Poterucha وآخرون
الموضوع الرئيسي: أمراض وصمامات القلب والعلاجات

الطرق

يستعرض قسم “الطرق” تصميم التجربة والتقنيات التحليلية المستخدمة في الدراسة. استخدم الباحثون نهجًا كميًا، حيث قاموا بإجراء تحليلات إحصائية لتقييم العلاقات بين المتغيرات. شملت جمع البيانات استبيانًا منظمًا تم إدارته لعينة سكانية، مما يضمن تمثيل ديموغرافي مناسب. تضمن الاستبيان أدوات موثوقة لقياس المفاهيم الرئيسية، مما يعزز موثوقية النتائج.

لتحليل البيانات، طبق الباحثون تحليل الانحدار، مما سمح بفحص العلاقات التنبؤية بين المتغيرات ذات الاهتمام. بالإضافة إلى ذلك، استخدموا الإحصاءات الوصفية لتلخيص خصائص البيانات وتقييم توزيع الاستجابات. تم تصميم المنهجية لضمان الصرامة وإمكانية التكرار، مع معالجة الاعتبارات الأخلاقية المناسبة طوال عملية البحث.

المناقشة

في هذه الدراسة، تم تطوير نموذج شبكة عصبية تلافيفية يسمى EchoNext والتحقق من صحته باستخدام مجموعة بيانات شاملة تضم 1,245,273 زوجًا من تخطيط القلب بالموجات فوق الصوتية من 230,318 مريضًا فريدًا في مستشفيات نيويورك-بريسبتيريان. تم تقسيم مجموعة البيانات إلى مجموعات تدريب (149,819 مريضًا)، والتحقق (35,780 مريضًا)، ومجموعات اختبار (44,719 مريضًا)، مع التركيز على تحديد أمراض القلب الهيكلية (SHD) بناءً على معايير تخطيط القلب بالموجات فوق الصوتية المعتمدة. أظهر النموذج أداءً عاليًا في التنبؤ بـ SHD، محققًا منطقة تحت منحنى خصائص التشغيل المستقبلية (AUROC) بنسبة 85.2% ومنطقة تحت منحنى الدقة والاسترجاع (AUPRC) بنسبة 78.5% في مجموعة الاختبار. ومن الجدير بالذكر أن الأداء اختلف عبر مكونات المرض الفردية، حيث أظهرت اختلالات البطين الأيمن وضعف انقباض البطين الأيسر المنخفض أعلى قيم AUROC (91% و90% على التوالي).

تم إجراء تحقق خارجي لـ EchoNext عبر ثلاث مجموعات مستقلة، مما كشف عن انخفاض طفيف في الأداء (AUROC 78-80%) مقارنة بمجموعة الاختبار الداخلية، والذي يُعزى إلى اختلافات في انتشار المرض وديموغرافيات المرضى. علاوة على ذلك، أشار تقييم النشر الصامت إلى أن 18% من المرضى الذين خضعوا لتخطيط القلب بالموجات فوق الصوتية في المتابعة تم تشخيصهم حديثًا بـ SHD، مع الحفاظ على أداء تنبؤي قوي للنموذج (AUROC 83%، AUPRC 81%). أظهر التحليل المقارن مع أطباء القلب أنه بينما حسنت المساعدة من الذكاء الاصطناعي الدقة التشخيصية، تفوق نموذج EchoNext على أطباء القلب سواء بشكل مستقل أو مع دعم الذكاء الاصطناعي. تختتم الدراسة بإصدار مجموعة بيانات ECG غير محددة الهوية لأغراض البحث والمقارنة المستقبلية، مما يبرز إمكانيات الذكاء الاصطناعي في تعزيز اكتشاف SHD في الممارسة السريرية.

القيود

تقدم الدراسة عدة قيود قد تؤثر على تفسير نتائجها. أولاً، فإن استخدام حدود ثنائية تعسفية للقيم المستمرة، مثل كسر قذف البطين الأيسر (LVEF) وسمك جدار البطين الأيسر، يقدم تباينًا محتملاً في النتائج. يتماشى العتبة المختارة بنسبة 45% لـ LVEF مع التعريفات الحديثة لفشل القلب، ولكن قد تؤدي إلى نتائج مختلفة إذا تم استخدام حدود بديلة. على الرغم من ذلك، أظهر النموذج أداءً ثابتًا، مع منطقة تحت منحنى خصائص التشغيل المستقبلية (AUROC) بنسبة 87.7% عبر عتبات مختلفة، مما يدل على متانة قدرته التنبؤية.

بالإضافة إلى ذلك، فإن الاعتماد على البيانات الاسترجاعية، التي تشمل المرضى الذين لديهم تخطيط قلب (ECGs) وتخطيط القلب بالموجات فوق الصوتية، قد لا يعكس بدقة الأداء المتوقع في سياق فحص أوسع حيث يكون لدى المرضى تخطيط قلب فقط. تعترف الدراسة بتحدي ضوضاء التسمية بسبب التقييمات الذاتية، خاصةً للحالات الشائعة مثل انخفاض سمك جدار البطين الأيسر، والتمثيل الناقص للحالات النادرة، مثل الارتجاع الرئوي. قد يؤثر النهج متعدد التسميات المستخدم لتدريب النموذج، على الرغم من فائدته في التقاط الارتباطات بين الأمراض، على الأداء في التسميات الفردية. على الرغم من أن النتائج الأولية من تجربة DISCOVERY باستخدام نموذج EchoNext واعدة، إلا أن الدراسات الكبيرة النطاق الأخرى ضرورية لتقييم فائدته السريرية وفعاليته في تحسين النتائج للمرضى الذين يعانون من أمراض القلب الهيكلية (SHD).

Journal: Nature, Volume: 644, Issue: 8075
DOI: https://doi.org/10.1038/s41586-025-09227-0
PMID: https://pubmed.ncbi.nlm.nih.gov/40670798
Publication Date: 2025-07-16
Author(s): Timothy J. Poterucha et al.
Primary Topic: Cardiac Valve Diseases and Treatments

Methods

The “Methods” section outlines the experimental design and analytical techniques employed in the study. The researchers utilized a quantitative approach, employing statistical analyses to assess the relationships between variables. Data collection involved a structured survey administered to a sample population, ensuring a representative demographic. The survey included validated instruments to measure key constructs, enhancing the reliability of the findings.

To analyze the data, the researchers applied regression analysis, allowing for the examination of predictive relationships among the variables of interest. Additionally, they employed descriptive statistics to summarize the data characteristics and assess the distribution of responses. The methodology was designed to ensure rigor and reproducibility, with appropriate ethical considerations addressed throughout the research process.

Discussion

In this study, a convolutional neural network model named EchoNext was developed and validated using a comprehensive dataset of 1,245,273 ECG-echocardiogram pairs from 230,318 unique patients at New York-Presbyterian hospitals. The dataset was divided into training (149,819 patients), validation (35,780 patients), and test sets (44,719 patients), with a focus on identifying structural heart disease (SHD) based on established echocardiographic criteria. The model demonstrated high performance in predicting SHD, achieving an area under the receiver operating characteristic curve (AUROC) of 85.2% and an area under the precision-recall curve (AUPRC) of 78.5% in the test set. Notably, performance varied across individual disease components, with right ventricular dysfunction and low left ventricular systolic dysfunction showing the highest AUROC values (91% and 90%, respectively).

External validation of EchoNext was conducted across three independent cohorts, revealing a slight decrease in performance (AUROC 78-80%) compared to the internal test set, attributed to differences in disease prevalence and patient demographics. Furthermore, a silent deployment evaluation indicated that 18% of patients who underwent follow-up echocardiograms were newly diagnosed with SHD, with the model maintaining robust predictive performance (AUROC 83%, AUPRC 81%). Comparative analysis with cardiologists revealed that while AI assistance improved diagnostic accuracy, the EchoNext model outperformed cardiologists both independently and with AI support. The study concludes with the release of a de-identified ECG dataset for future research and benchmarking, highlighting the potential of AI in enhancing SHD detection in clinical practice.

Limitations

The study presents several limitations that may affect the interpretation of its findings. Firstly, the use of arbitrary binary cutoffs for continuous values, such as left ventricular ejection fraction (LVEF) and left ventricular wall thickness, introduces potential variability in results. The chosen threshold of 45% for LVEF aligns with recent definitions of heart failure but may yield different outcomes if alternative cutoffs were employed. Despite this, the model demonstrated consistent performance, with an area under the receiver operating characteristic curve (AUROC) of 87.7% across different thresholds, indicating robustness in its predictive capability.

Additionally, the reliance on retrospective data, which includes patients with both electrocardiograms (ECGs) and echocardiograms, may not accurately reflect the expected performance in a broader screening context where patients only have ECGs. The study acknowledges the challenge of label noise due to subjective assessments, particularly for prevalent conditions like low left ventricular wall thickness, and the underrepresentation of rare conditions, such as pulmonary regurgitation. The multilabel approach used to train the model, while beneficial for capturing correlations among diseases, may compromise performance on individual labels. Although initial results from the DISCOVERY trial using the EchoNext model are promising, further large-scale studies are necessary to evaluate its clinical utility and effectiveness in improving outcomes for patients with structural heart disease (SHD).