تشخيص الأمراض العصبية التنكسية المعتمد على EEG: تحليل مقارن للطرق التقليدية ونماذج التعلم العميق EEG-based neurodegenerative disease diagnosis: comparative analysis of conventional methods and deep learning models

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-00292-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40335527
تاريخ النشر: 2025-05-07
المؤلف: B R Nayana وآخرون
الموضوع الرئيسي: تخطيط الدماغ وواجهات الدماغ-الكمبيوتر

نظرة عامة

تبحث الدراسة في تشخيص الخرف باستخدام إشارات EEG، مدفوعة بالزيادة العالمية في انتشار الحالة بسبب عوامل نمط الحياة والبيئة. تستخدم الدراسة ثلاث منهجيات: نهج تقليدي للتعلم الآلي باستخدام مصنف Random Forest بعد المعالجة المسبقة واستخراج الميزات من كثافة الطيف الترددي، ونموذج شبكة عصبية تلافيفية 1D (CNN) يتم تغذيته بإشارات EEG المعالجة مسبقًا، ونموذج CNN ثنائي الأبعاد باستخدام صور طيفية مكدسة مستمدة من إشارات EEG المفككة. تكشف التقييمات عبر ثلاثة مجموعات بيانات مرجعية، والتي تشمل تصنيفات للأفراد ذوي الإدراك الطبيعي، وخرف الفص الجبهي، وضعف الإدراك الخفيف، ومرض الزهايمر، أن نماذج التعلم العميق، وخاصة 1D و 2D CNN، تتفوق بشكل كبير على الطرق التقليدية. على سبيل المثال، حقق نموذج 2D CNN دقة بلغت 91.13% على مجموعة البيانات 1، مقارنة بـ 84.78% لنموذج Random Forest.

تختتم الدراسة بتسليط الضوء على تحديد الأنماط الخفية المرتبطة بأنواع مختلفة من الخرف، مع التأكيد على الحاجة إلى تطوير نماذج متقدمة مصممة لتناسب مراحل مختلفة من المرض. تشير إلى التحديات العملية التي تم مواجهتها خلال التحليل، بما في ذلك عدم توازن البيانات ومشكلات قابلية تعميم النموذج عبر مجموعات البيانات. بينما أظهر نموذج 1D CNN أداءً متفوقًا، خاصة في مجموعة البيانات B، واجه نموذج 2D CNN تحديات الإفراط في التكيف في مجموعة البيانات C. يقترح المؤلفون أن العمل المستقبلي يمكن أن يركز على تعزيز أداء النموذج وقابلية تعميمه من خلال تقنيات مثل SMOTE وزيادة البيانات المعتمدة على GAN، والهياكل المتقدمة للمحول، والنماذج الهجينة التي تستفيد من كل من 1D و 2D CNN، إلى جانب استكشاف آليات الانتباه والشبكات العصبية الرسومية لتحسين دقة التصنيف.

الطرق

في هذه الدراسة، استخدم المؤلفون طريقة ويلش لتقدير كثافة الطيف الترددي (PSD) على بيانات EEG المعالجة مسبقًا لاستخراج ميزات المجال الترددي الحيوية لتحليل الحالات الإدراكية. تم حساب PSD، الذي يوضح توزيع الطاقة لإشارة عبر ترددات مختلفة، لشرائط محددة: دلتا (0.5-4 هرتز)، ثيتا (4-8 هرتز)، ألفا (8-13 هرتز)، بيتا (13-25 هرتز)، وغاما (25-45 هرتز). تم حساب ملخصات إحصائية (متوسط، وسيط، انحراف معياري) لقيم PSD لكل شريط، مما يكشف أن حالات مثل مرض الزهايمر (AD)، وخرف الفص الجبهي (FTD)، والأفراد ذوي الإدراك الطبيعي (CN) أظهرت طاقة أعلى في نطاقات الترددات المنخفضة، وهو أمر نموذجي لإشارات EEG. من الجدير بالذكر أن التحليل أشار إلى تقدم واضح في تدهور الإدراك من CN إلى ضعف الإدراك الخفيف (MCI) إلى AD، حيث أظهر MCI تباينًا وطاقة أعلى عند الترددات المنخفضة مقارنة بقيم PSD المستقرة في CN.

تم استخدام مصنف Random Forest (RF) للتنبؤ بالتسميات بناءً على الميزات المستخرجة، وتم تقييم مقاييس الأداء مثل الدقة، والدقة، والاسترجاع، ودرجة F1. أظهرت النتائج أن نموذج RF حقق دقة بلغت 90.15% لمجموعة البيانات B، بينما سجلت مجموعات البيانات A و C بين 77.3% و 84.77%. تشمل الميزات الرئيسية المحددة دلتا ميديان وثيتا ميديان لمجموعة البيانات A، وألفا ميديان وألفا وسيط لمجموعة البيانات B، مما يشير إلى إمكاناتها كعلامات حيوية للأمراض التنكسية العصبية. كما سلطت الدراسة الضوء على أهمية اختيار الميزات في تعزيز دقة التصنيف، حيث قدم تحليل SHAP رؤى حول أهمية الميزات عبر مجموعات البيانات.

المناقشة

تسلط قسم المناقشة في الورقة الضوء على استخدام ثلاث نهج متميزة لتشخيص الخرف من خلال إشارات EEG، مع التأكيد على مزايا نماذج التعلم العميق (DL) مقارنة بأساليب التعلم الآلي التقليدية (ML). تقارن الدراسة بين مصنف Random Forest (RF)، وشبكة عصبية تلافيفية 1D (CNN)، وCNN ثنائية الأبعاد، مما يوضح أن نماذج DL تعزز بشكل كبير أداء التصنيف من خلال استخراج الميزات الهيكلية تلقائيًا من بيانات EEG الخام. تلتقط 1D CNN الميزات الزمنية بفعالية، بينما تتفوق 2D CNN في تحديد الأنماط الزمانية المكانية المعقدة من الطيف، والتي تعتبر حاسمة لتشخيص الأمراض التنكسية العصبية.

تكشف النتائج أن 1D CNN حققت دقة بلغت 90% على مجموعة البيانات A و 98.74% على مجموعة البيانات B، بينما قدمت مجموعة البيانات C تحديات بدقة أقل بلغت 78.03%. تؤكد الدراسة على أهمية خصائص مجموعة البيانات في أداء النموذج، حيث تشير التحليلات الإحصائية إلى اختلافات كبيرة عبر مجموعات البيانات ولكن ليس في مقاييس الأداء. يُقترح أن يركز العمل المستقبلي على تحسين تعميم النموذج وقابلية تفسيره، واستكشاف تقنيات متقدمة لرفض الشوائب، ودمج مصادر البيانات متعددة الأنماط. تختتم الورقة بالقول إنه بينما تظهر نماذج DL وعدًا في تحديد ميزات EEG المرتبطة بالخرف، لا تزال القيود العملية مثل العبء الحسابي وقابلية تفسير النموذج تحديات للتطبيق السريري.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-00292-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40335527
Publication Date: 2025-05-07
Author(s): B R Nayana et al.
Primary Topic: EEG and Brain-Computer Interfaces

Overview

The research investigates the diagnosis of dementia using EEG signals, driven by the increasing global prevalence of the condition due to lifestyle and environmental factors. The study employs three methodologies: a conventional machine learning approach utilizing a Random Forest classifier after pre-processing and feature extraction from power spectral density, a 1D Convolutional Neural Network (CNN) model fed with pre-processed EEG signals, and a 2D CNN model using stacked spectrogram images derived from decomposed EEG signals. Evaluations across three benchmark datasets, which include classifications for cognitively normal individuals, frontotemporal dementia, mild cognitive impairment, and Alzheimer’s disease, reveal that deep learning models, particularly the 1D and 2D CNNs, significantly outperform conventional methods. For instance, the 2D CNN achieved an accuracy of 91.13% on Dataset 1, compared to 84.78% for the Random Forest model.

The study concludes by highlighting the identification of hidden patterns associated with different types of dementia, emphasizing the need for advanced model development tailored to various stages of the disease. It notes practical challenges encountered during the analysis, including data imbalance and model generalizability issues across datasets. While the 1D CNN demonstrated superior performance, particularly in Dataset B, the 2D CNN faced overfitting challenges in Dataset C. The authors suggest future work could focus on enhancing model performance and generalizability through techniques such as SMOTE and GAN-based augmentation, advanced transformer architectures, and hybrid models that leverage both 1D and 2D CNNs, alongside the exploration of attention mechanisms and graph neural networks to improve classification accuracy.

Methods

In this study, the authors employed Welch’s method for power spectral density (PSD) estimation on pre-processed EEG data to extract frequency-domain features critical for analyzing cognitive conditions. The PSD, which illustrates the power distribution of a signal across various frequencies, was calculated for specific bands: Delta (0.5-4 Hz), Theta (4-8 Hz), Alpha (8-13 Hz), Beta (13-25 Hz), and Gamma (25-45 Hz). Statistical summaries (mean, median, standard deviation) of the PSD values were computed for each band, revealing that conditions such as Alzheimer’s Disease (AD), Frontotemporal Dementia (FTD), and Cognitively Normal (CN) individuals exhibited higher power in lower frequency ranges, typical of EEG signals. Notably, the analysis indicated a distinct cognitive decline progression from CN to Mild Cognitive Impairment (MCI) to AD, with MCI showing variability and higher power at lower frequencies compared to stable PSD values in CN.

The Random Forest (RF) classifier was utilized to predict labels based on the extracted features, with performance metrics such as accuracy, precision, recall, and F1 score evaluated. The results demonstrated that the RF model achieved an accuracy of 90.15% for Dataset B, while Datasets A and C scored between 77.3% and 84.77%. Key features identified included Delta Mean and Theta Mean for Dataset A, and Alpha Mean and Alpha Median for Dataset B, suggesting their potential as biomarkers for neurodegenerative diseases. The study also highlighted the importance of feature selection in enhancing classification accuracy, with SHAP analysis providing insights into feature significance across datasets.

Discussion

The discussion section of the paper highlights the utilization of three distinct approaches for diagnosing dementia through EEG signals, emphasizing the advantages of deep learning (DL) models over traditional machine learning (ML) methods. The study compares a random forest (RF) classifier, a 1D convolutional neural network (CNN), and a 2D CNN, demonstrating that DL models significantly enhance classification performance by automatically extracting hierarchical features from raw EEG data. The 1D CNN effectively captures temporal features, while the 2D CNN excels in identifying complex spatiotemporal patterns from spectrograms, which are crucial for diagnosing neurodegenerative diseases.

The findings reveal that the 1D CNN achieved an accuracy of 90% on Dataset A and 98.74% on Dataset B, while Dataset C presented challenges with a lower accuracy of 78.03%. The study underscores the importance of dataset characteristics in model performance, with statistical analyses indicating significant differences across datasets but not in performance metrics. Future work is suggested to focus on improving model generalization and interpretability, exploring advanced artifact rejection techniques, and integrating multimodal data sources. The paper concludes that while DL models show promise in identifying EEG features associated with dementia, practical limitations such as computational overhead and model interpretability remain challenges for clinical application.