ضبط الشبكات العصبية القائمة على الانتباه من نوع الذاكرة القصيرة والطويلة لاكتشاف مرض باركنسون باستخدام تحسينات ميتاهيرستية معدلة
Tuning attention based long-short term memory neural networks for Parkinson’s disease detection using modified metaheuristics

المجلة: Scientific Reports، المجلد: 14، العدد: 1
DOI: https://doi.org/10.1038/s41598-024-54680-y
PMID: https://pubmed.ncbi.nlm.nih.gov/38383690
تاريخ النشر: 2024-02-21
المؤلف: Aleksa Ćuk وآخرون
الموضوع الرئيسي: كشف وتصنيف أورام الدماغ

نظرة عامة

تستكشف هذه الورقة البحثية تطبيق الشبكات العصبية ذات الذاكرة الطويلة والقصيرة (LSTM) مع آليات الانتباه للكشف المبكر عن مرض باركنسون (PD) باستخدام بيانات اختبار المشي المزدوج. يُعتبر مرض باركنسون اضطرابًا تنكسيًا عصبيًا يتميز بأعراض مثل الرعشات أثناء الراحة وبطء الحركة، حيث يعتمد التشخيص بشكل أساسي على التقييم السريري، والذي غالبًا ما يكون ذاتيًا وغير دقيق. تؤكد الدراسة على أهمية الكشف المبكر لتحسين جودة حياة المرضى، على الرغم من عدم وجود علاج. تم اقتراح خوارزمية تحسين جراد البحر المعدلة (MCOA) لتعزيز أداء نماذج LSTM، محققة دقة تبلغ 87.4187% على مجموعة بيانات سريرية متاحة للجمهور.

تشير النتائج إلى أن نماذج LSTM المعتمدة على الانتباه، المدربة على بيانات العالم الحقيقي، تكشف بفعالية عن علامات مرض باركنسون، حيث تظهر MCOA أداءً متفوقًا في تحسين المعلمات مقارنةً بالطرق التقليدية. ومع ذلك، تعترف الدراسة بالقيود، بما في ذلك القيود الحاسوبية التي حدت من نطاق خوارزميات التحسين التي تم اختبارها ومجموعة البيانات المحدودة المتاحة للتحليل. تشمل اتجاهات البحث المستقبلية تحسين طرق الكشف واستكشاف هياكل الشبكات المتكررة الإضافية، بالإضافة إلى التطبيقات المحتملة لـ MCOA في مجالات مثل أمان الكمبيوتر.

مقدمة

تعمل دمج الذكاء الاصطناعي (AI) في التشخيص الطبي على تحويل الرعاية الصحية من خلال تعزيز دقة التشخيص، وتقليل التكاليف، وتحسين نتائج المرضى. توضح تطبيقات الذكاء الاصطناعي في الأشعة، مثل الكشف المبكر عن سرطان الرئة من خلال خوارزميات التعلم العميق ثلاثي الأبعاد وتحديد اعتلال الشبكية السكري من الصور الشبكية، إمكانياته. في علم الأمراض، حسّن الذكاء الاصطناعي تشخيص السرطان وتصنيف الأورام، بينما أظهر في علم القلب وعودًا في تحليل تخطيط القلب الكهربائي (ECGs) وتخطيط صدى القلب للكشف عن عدم انتظام ضربات القلب وأمراض القلب. من الجدير بالذكر أن تقنيات التعلم العميق حققت دقة تزيد عن 98% في الكشف عن عدم انتظام ضربات القلب من خلال تحسين مساحات المعلمات الكبيرة.

في التشخيص العصبي، تحلل خوارزميات الذكاء الاصطناعي البيانات المعقدة بفعالية، بما في ذلك الصور الطبية والقياسات الكهربية، مما يسهل تشخيص الاضطرابات العصبية مثل مرض الزهايمر والصرع. استكشفت الدراسات الحديثة طرق تشخيص مبتكرة لمرض باركنسون (PD)، مثل اختبار النقر بالأصابع البعيدة (DFT)، الذي أظهر حساسية ودقة عالية في تمييز مرضى PD عن الضوابط. بالإضافة إلى ذلك، قدم استخدام تكنولوجيا الرؤية الحاسوبية، مثل DeepLabCut، طريقة غير تلامسية لتقييم بطء الحركة، تتوافق جيدًا مع التقييمات السريرية. على الرغم من التقدم، لا يزال هناك فجوة بحثية في الكشف عن السلاسل الزمنية وضبط المعلمات لتشخيص PD، وهو ما تهدف هذه الدراسة إلى معالجته من خلال اقتراح نهج تشخيصي منخفض التكلفة مدعوم بالذكاء الاصطناعي.

طرق

في هذا القسم، يوضح المؤلفون إعداد التجربة لتقييم طريقتهم المقترحة باستخدام مجموعة بيانات سريرية متاحة للجمهور مأخوذة من مسرعات مثبتة على الأحذية. مجموعة البيانات منظمة جيدًا، ومُعَيارَة، وخالية من القيم المفقودة، مما يجعلها مناسبة لتصنيف السلاسل الزمنية. تتضمن مرحلة المعالجة المسبقة تحويل البيانات النصية إلى إطار بيانات منظم، ووضع علامات على العينات وفقًا لحالة المريض، ودمج المعلومات من عدة مرضى لإنشاء مجموعة بيانات متوازنة. يستخدم المؤلفون مولد سلسلة زمنية من TensorFlow بفارق زمني قدره 15 وحجم دفعة قدره 1 لتدريب النموذج.

تم تحسين بنية نموذج الانتباه LSTM (LSTM-ATT) من خلال تغيير عدد الطبقات (بين 1 و 3) وعدد الخلايا العصبية لكل طبقة (بين 5 و 15). يتم أيضًا ضبط معلمات التدريب، بما في ذلك عدد الدورات (30 إلى 60)، ومعدلات التسرب (0.05 إلى 0.2)، ومعدلات التعلم (0.0001 إلى 0.01)، مع تنفيذ التوقف المبكر للتخفيف من الإفراط في التكيف. تقارن الدراسة خوارزمية MCOA المقترحة ضد عدة خوارزميات ميتاheuristics معروفة، بما في ذلك الخوارزمية الجينية (GA)، وتحسين سرب الجسيمات (PSO)، وغيرها، تحت ظروف اختبار متسقة. يتم استخدام مقاييس الأداء مثل الدقة، والدقة، والاسترجاع، ودرجة F1، وكابا كوهين لتقييم إمكانات تحسين الخوارزميات، مع تعريف معدل الخطأ كـ \( \text{Error\_rate} = 1 – \text{Accuracy} \) وكابا كوهين محسوبًا كـ \( \kappa = \frac{v_o – v_e}{1 – v_e} \)، حيث تمثل \( v_o \) و \( v_e \) القيم المرصودة والمتوقعة، على التوالي. يتم تكرار التجارب 30 مرة لضمان موثوقية النتائج.

مناقشة

تتناول قسم المناقشة قدرات وآليات الشبكات العصبية ذات الذاكرة الطويلة والقصيرة (LSTM)، لا سيما في معالجة قيود الشبكات العصبية التكرارية التقليدية (RNNs) فيما يتعلق بالاعتمادات طويلة الأجل. تستخدم LSTMs حالة خلوية للحفاظ على المعلومات على مر الزمن، مدعومة بثلاثة أبواب: باب النسيان، وباب الإدخال، وباب الإخراج، التي تنظم تدفق المعلومات. يقدم القسم أيضًا آلية الانتباه لوونغ، التي تعزز أداء LSTM من خلال تخصيص أوزان متغيرة لتسلسلات الإدخال، مما يحسن قدرة النموذج على التقاط علاقات الإدخال والإخراج.

علاوة على ذلك، تناقش الورقة دور خوارزميات الميتاheuristics في تحسين المعلمات، مع التأكيد على فعاليتها في التنقل في الطبيعة الصعبة لهذه المشكلة. يقدم المؤلفون خوارزمية تحسين جراد البحر المعدلة (MCOA)، التي تتضمن آليات من خوارزميات أخرى لتعزيز معدلات الاستكشاف والتقارب. تظهر نتائج المحاكاة أن MCOA تتفوق على كل من خوارزمية تحسين جراد البحر الأصلية وغيرها من الخوارزميات المقارنة، محققة تحسينات ذات دلالة إحصائية في أداء النموذج لشبكات LSTM-ATT. تؤكد النتائج على إمكانيات MCOA في تحسين المعلمات للنماذج المعقدة، على الرغم من أن الدراسة تعترف بالقيود المتعلقة بالموارد الحاسوبية وتوافر البيانات، مما يقترح مجالات للبحث المستقبلي في طرق الكشف المبكر وتطبيقات أوسع للخوارزمية المقترحة للتحسين.

Journal: Scientific Reports, Volume: 14, Issue: 1
DOI: https://doi.org/10.1038/s41598-024-54680-y
PMID: https://pubmed.ncbi.nlm.nih.gov/38383690
Publication Date: 2024-02-21
Author(s): Aleksa Ćuk et al.
Primary Topic: Brain Tumor Detection and Classification

Overview

This research paper investigates the application of long-short term memory (LSTM) neural networks with attention mechanisms for the early detection of Parkinson’s disease (PD) using dual-task walking test data. PD is a neurodegenerative disorder characterized by symptoms such as resting tremors and bradykinesia, with diagnosis primarily reliant on clinical evaluation, which is often subjective and imprecise. The study emphasizes the importance of early detection for improving patient quality of life, despite the absence of a cure. A modified crayfish optimization algorithm (MCOA) is proposed to enhance the performance of LSTM models, achieving an accuracy of 87.4187% on a publicly available clinical gait dataset.

The findings indicate that the attention-based LSTM models, trained on real-world data, effectively detect signs of PD, with the MCOA demonstrating superior performance in hyperparameter optimization compared to traditional methods. However, the study acknowledges limitations, including computational constraints that restricted the range of optimization algorithms tested and the limited dataset available for analysis. Future research directions include refining detection methods and exploring additional recurrent network architectures, as well as potential applications of the MCOA in fields such as computer security.

Introduction

The integration of artificial intelligence (AI) into medical diagnostics is transforming healthcare by enhancing diagnostic accuracy, reducing costs, and improving patient outcomes. AI applications in radiology, such as the early detection of lung cancer through 3D deep learning algorithms and the identification of diabetic retinopathy from retinal images, illustrate its potential. In pathology, AI has improved cancer diagnosis and tumor classification, while in cardiology, it has shown promise in analyzing electrocardiograms (ECGs) and echocardiograms for arrhythmia and cardiac disease detection. Notably, deep learning techniques have achieved over 98% accuracy in arrhythmia detection by optimizing large parameter spaces.

In neurodiagnostics, AI algorithms effectively analyze complex data, including medical imagery and electrophysiological measurements, facilitating the diagnosis of neurological disorders like Alzheimer’s disease and epilepsy. Recent studies have explored innovative diagnostic methods for Parkinson’s disease (PD), such as the Distal Finger Tapping (DFT) test, which demonstrated high sensitivity and accuracy in distinguishing PD patients from controls. Additionally, the use of computer vision technology, like DeepLabCut, has provided a contactless method for assessing bradykinesia, correlating well with clinical evaluations. Despite advancements, there remains a research gap in time-series detection and parameter tuning for PD diagnosis, which this work aims to address by proposing a low-cost, AI-powered diagnostic approach.

Methods

In this section, the authors detail the experimental setup for evaluating their proposed method using a publicly available clinical dataset sourced from shoe-mounted accelerators. The dataset is well-organized, normalized, and devoid of missing values, making it suitable for time-series classification. The preprocessing phase involves converting the text-based data into a structured data frame, labeling samples according to patient status, and amalgamating information from multiple patients to create a balanced dataset. The authors employ a TensorFlow time series generator with a lag of 15 and a batch size of 1 for model training.

The architecture of the LSTM attention model (LSTM-ATT) is optimized by varying the number of layers (between 1 and 3) and neurons per layer (between 5 and 15). Training parameters, including epochs (30 to 60), dropout rates (0.05 to 0.2), and learning rates (0.0001 to 0.01), are also fine-tuned, with early stopping implemented to mitigate overfitting. The study compares the proposed MCOA algorithm against several established metaheuristics, including Genetic Algorithm (GA), Particle Swarm Optimization (PSO), and others, under consistent testing conditions. Performance metrics such as accuracy, precision, recall, F1-score, and Cohen’s kappa are utilized to evaluate the optimization potential of the algorithms, with the error rate defined as \( \text{Error\_rate} = 1 – \text{Accuracy} \) and Cohen’s kappa calculated as \( \kappa = \frac{v_o – v_e}{1 – v_e} \), where \( v_o \) and \( v_e \) represent observed and expected values, respectively. The experiments are repeated 30 times to ensure reliability in the results.

Discussion

The discussion section elaborates on the capabilities and mechanisms of Long Short-Term Memory (LSTM) networks, particularly in addressing the limitations of traditional Recurrent Neural Networks (RNNs) regarding long-term dependencies. LSTMs utilize a cell state to maintain information over time, supported by three gates: the forget gate, input gate, and output gate, which regulate the flow of information. The section also introduces the Luong attention mechanism, which enhances LSTM performance by assigning varying weights to input sequences, thereby improving the model’s ability to capture input-output relationships.

Furthermore, the paper discusses the role of metaheuristic algorithms in hyperparameter optimization, emphasizing their effectiveness in navigating the NP-hard nature of this problem. The authors present a modified Crayfish Optimization Algorithm (MCOA), which incorporates mechanisms from other algorithms to enhance exploration and convergence rates. Simulation results demonstrate that MCOA outperforms both the original Crayfish Optimization Algorithm and other comparative algorithms, achieving statistically significant improvements in model performance for LSTM-ATT networks. The findings underscore the potential of the MCOA in optimizing hyperparameters for complex models, although the study acknowledges limitations related to computational resources and data availability, suggesting avenues for future research in early detection methods and broader applications of the proposed optimization algorithm.