DOI: https://doi.org/10.22399/ijcesen.701
تاريخ النشر: 2025-01-04
المؤلف: Johnsymol Joy وآخرون
الموضوع الرئيسي: كشف وتصنيف أورام الدماغ
نظرة عامة
تتناول ورقة البحث التحديات المتعلقة بتشخيص مرض الزهايمر، وهو اضطراب تنكسي عصبي يتميز بفقدان خلايا الدماغ وضمور الأنسجة، مما يؤثر بشكل كبير على جودة حياة المرضى. إن الكشف المبكر والعلاج أمران حاسمان لتحسين نتائج المرضى، مما يستلزم تقييمات سريرية مستمرة. تسلط الدراسة الضوء على الاعتماد على تقنيات التعلم العميق لتحليل الصور الطبية، وخاصة في التغلب على المشكلات المتعلقة بنقص البيانات وعدم التوازن. لمواجهة هذه التحديات، يقترح المؤلفون نموذج تعلم عميق هجين يصنف أنواع مرض الزهايمر المختلفة باستخدام بيانات التصوير بالرنين المغناطيسي (MRI).
تشمل المنهجية المقترحة معالجة صور الرنين المغناطيسي من خلال تقنيات التمويه والتوضيح، تليها استخراج الميزات باستخدام شبكة عصبية تلافيفية (CNN) تم تدريبها مسبقًا على مجموعة بيانات MNIST. ثم يتم تقليل هذه الميزات باستخدام مصنف شجرة إضافية قبل إدخالها في شبكة عصبية عميقة مخصصة (DNN). تشير النتائج إلى أن النموذج، الذي يستخدم بنية ResNet المدربة مسبقًا مع تنظيم الإسقاط، يحقق دقة تدريب تبلغ 98.20% ودقة تحقق تبلغ 92.61%، مما يعالج بشكل فعال مشكلة الإفراط في التخصيص ويظهر إمكاناته في التصنيف متعدد الفئات في تشخيص الزهايمر. تؤكد الدراسة على أهمية دمج نماذج التعلم العميق المتقدمة لتعزيز استراتيجيات الكشف المبكر والعلاج للأمراض التنكسية العصبية.
مقدمة
تناقش مقدمة ورقة البحث مرض الزهايمر (AD)، وهو اضطراب تنكسي عصبي شائع يؤدي إلى تدهور إدراكي كبير ويعتبر سببًا رئيسيًا للخرف بين كبار السن. يؤثر حاليًا على أكثر من ستة ملايين أمريكي، ومن المتوقع أن يرتفع هذا الرقم إلى أكثر من 13 مليون بحلول عام 2050. تسلط الورقة الضوء على الدور الحاسم للعلامات الحيوية وتقنيات تصوير الدماغ المختلفة—مثل التصوير بالرنين المغناطيسي (MRI)، والتصوير المقطعي المحوسب (CT)، والتصوير المقطعي بالإصدار البوزيتروني (PET)—في تشخيص مرض الزهايمر. يتم تصنيف المرض إلى أشكال مبكرة ومتأخرة، حيث تكون الأخيرة أكثر شيوعًا وتؤثر بشكل أساسي على الأفراد الذين تتراوح أعمارهم بين 65 عامًا وما فوق. على الرغم من عدم وجود علاج، فإن الكشف المبكر، وخاصة في المرحلة البادرة التي تتميز بضعف إدراكي خفيف (MCI)، أمر ضروري لإدارة المرض.
يقترح المؤلفون نموذجًا هجينًا جديدًا للتعلم العميق-التعلم الآلي (DL-ML) يهدف إلى تصنيف مراحل مرض الزهايمر باستخدام مجموعة ميزات مخفضة مستمدة من صور الرنين المغناطيسي. تستعرض المقدمة الأدبيات الحالية حول تطبيقات التعلم العميق في تشخيص مرض الزهايمر، مشيرة إلى منهجيات مختلفة ودقتها النسبية. على سبيل المثال، استخدمت الدراسات السابقة تقنيات مثل التعلم الانتقالي على مستوى الطبقات والشبكات التنافسية التوليدية، محققة دقة تصنيف تتراوح بين 83.72% إلى 95.73%. يسعى النموذج المقترح إلى تعزيز دقة وكفاءة التشخيص، مستفيدًا من خوارزميات التعلم العميق المتقدمة لتحسين الكشف المبكر وتقليل التكاليف العالية للرعاية المرتبطة بمرض الزهايمر.
طرق
في هذا القسم، يصف المؤلفون مجموعات البيانات والمنهجيات المستخدمة لتقييم أداء نماذجهم المقترحة لتصنيف مرض الزهايمر متعدد الفئات باستخدام صور الرنين المغناطيسي. تتكون مجموعة البيانات، المستمدة من كاجل، من صور مصنفة إلى أربع مجموعات: خرف خفيف (896 صورة)، خرف معتدل (64 صورة)، غير مصاب بالخرف (3200 صورة)، وخرف خفيف جدًا (2240 صورة). لمعالجة عدم التوازن الكبير في الفئات، قام المؤلفون بتحسين مجموعة البيانات عن طريق ضبط التمويه والحدة للصور الأصلية، مما أدى إلى مجموعة بيانات معدلة تحتوي على 8700 صورة للخرف الخفيف، و7200 للخرف المعتدل، و9600 لغير المصابين بالخرف، و8900 للخرف الخفيف جدًا.
تم تحديد الإطار الحسابي المستخدم لتدريب النموذج وتقييمه، والذي يتميز بنظام تشغيل ويندوز 10، وبطاقة رسومات NVIDIA Quadro GV100، ومعالج Intel Xeon Gold 6134. تم تنفيذ النماذج باستخدام مكتبة Keras مع TensorFlow كخلفية، وتم تحسينها لمهام التصميم والتصور المعززة بالذكاء الاصطناعي. تهدف هذه المنهجية إلى ضمان أداء قوي في تصنيف المراحل المختلفة لمرض الزهايمر بناءً على بيانات الرنين المغناطيسي.
نتائج
في هذا القسم، يتم تقديم نتائج اختبار نماذج التعلم العميق المختلفة لتصنيف مراحل مرض الزهايمر. استخدمت الدراسة بنية ResNet-50 وDenseNet-169، حيث حققت DenseNet-169 أداءً متفوقًا، مسجلة دقة تدريب واختبار تبلغ 97.7% و83.82%، على التوالي، مقارنةً بـ ResNet-50 التي حققت 88.70% و81.92%. تم أيضًا تطوير شبكة عصبية عميقة مخصصة (DNN)، مما أسفر عن دقة تبلغ 82% على مجموعة البيانات الأصلية و89% على مجموعة البيانات المعززة.
تضمنت النماذج المقترحة تقنيات استخراج الميزات وتقليلها، حيث حقق النموذج الهجين الأول (ResNet كمستخرج ميزات ومصنف شجرة إضافية كمقلل ميزات) دقة تدريب تبلغ 96.30% ودقة تحقق تبلغ 91.76%. أدت إضافة تنظيم الإسقاط إلى تحسين دقة التحقق إلى 92.61% مع تقليل الفجوة بين دقتي التدريب والتحقق. حقق النموذج الهجين الثاني باستخدام DenseNet نتائج مشابهة، حيث كانت دقة التدريب 97.74% ودقة التحقق 89.77% مع الإسقاط. أظهر النموذج الثالث، الذي يستخدم Xception، مقاييس أداء أقل. بشكل عام، أظهرت النماذج المقترحة، وخاصة النموذج الذي يستخدم ResNet، دقة محسنة وتقليل الإفراط في التخصيص مقارنةً بالنموذج الأساسي من الشري [26].
مناقشة
في هذا القسم، يقدم المؤلفون مناقشة شاملة لنماذجهم الهجينة المقترحة للتعلم العميق والتعلم الآلي (DL-ML) التي تهدف إلى معالجة عدم توازن البيانات في مهمة تصنيف متعددة الفئات باستخدام مجموعة بيانات الزهايمر. تتضمن المنهجية نهجًا متعدد الخطوات: في البداية، يتم تعزيز الصور من خلال تقنيات التمويه والتوضيح لزيادة تنوع مجموعة البيانات. بعد ذلك، يتم استخراج الميزات باستخدام الشبكات العصبية التلافيفية المدربة مسبقًا (CNNs) مثل ResNet وDenseNet وXception، والتي تستفيد من التعلم الانتقالي لتحسين أداء النموذج مع تقليل وقت التدريب. ثم تتم معالجة الميزات المستخرجة من خلال مصنف Extra Tree لتقليل الأبعاد قبل إدخالها في شبكة عصبية عميقة مخصصة (DNN) للتصنيف.
يبرز المؤلفون فعالية نماذجهم، حيث أبلغوا عن دقة تحقق قصوى تبلغ 92.61% مع بنية ResNet. كما يؤكدون على أهمية مقاييس الأداء مثل الدقة، والدقة الإيجابية، والاسترجاع، ودرجة F1، خاصة في سياق مجموعات البيانات غير المتوازنة، حيث يتم استخدام المتوسط الكلي لضمان تقييم عادل عبر الفئات. لا تعالج الإطار المقترح فقط التحديات المتعلقة بنقص البيانات وعدم التوازن، بل تظهر أيضًا إمكانات النماذج الهجينة في تعزيز القدرات التشخيصية للأمراض التنكسية العصبية.
DOI: https://doi.org/10.22399/ijcesen.701
Publication Date: 2025-01-04
Author(s): Johnsymol Joy et al.
Primary Topic: Brain Tumor Detection and Classification
Overview
The research paper addresses the challenges of diagnosing Alzheimer’s disease, a neurodegenerative disorder characterized by brain cell loss and tissue atrophy, which significantly impacts patients’ quality of life. Early detection and treatment are crucial for improving patient outcomes, necessitating continuous clinical assessments. The study highlights the reliance on deep learning techniques for medical image analysis, particularly in overcoming issues related to data scarcity and imbalance. To tackle these challenges, the authors propose a hybrid deep learning model that classifies various Alzheimer’s disease variants using magnetic resonance imaging (MRI) data.
The proposed methodology involves preprocessing MRI images through blurring and sharpening techniques, followed by feature extraction using a Convolutional Neural Network (CNN) pre-trained on the MNIST dataset. These features are then reduced using an extra-tree classifier before being input into a customized Deep Neural Network (DNN). The results indicate that the model, which employs a pre-trained ResNet architecture with dropout regularization, achieves a training accuracy of 98.20% and a validation accuracy of 92.61%, effectively addressing overfitting and demonstrating its potential for multiclass classification in Alzheimer’s diagnosis. The study underscores the importance of integrating advanced deep learning models to enhance early detection and treatment strategies for neurodegenerative diseases.
Introduction
The introduction of the research paper discusses Alzheimer’s disease (AD), a prevalent neurodegenerative disorder that leads to significant cognitive decline and is a major cause of dementia among the elderly. Currently affecting over six million Americans, this figure is projected to rise to over 13 million by 2050. The paper highlights the critical role of biomarkers and various brain imaging techniques—such as Magnetic Resonance Imaging (MRI), Computed Tomography (CT), and Positron Emission Tomography (PET)—in diagnosing AD. The disease is categorized into early-onset and late-onset forms, with the latter being more common and primarily affecting individuals aged 65 and older. Despite the absence of a cure, early detection, particularly in the prodromal stage characterized by Mild Cognitive Impairment (MCI), is essential for managing the disease.
The authors propose a novel hybrid Deep Learning-Machine Learning (DL-ML) model aimed at classifying the stages of Alzheimer’s disease using a reduced feature set derived from MRI images. The introduction reviews existing literature on deep learning applications in AD diagnosis, noting various methodologies and their respective accuracies. For instance, previous studies have employed techniques such as layer-wise transfer learning and Generative Adversarial Networks, achieving classification accuracies ranging from 83.72% to 95.73%. The proposed model seeks to enhance diagnostic precision and efficiency, leveraging advanced deep learning algorithms to improve early detection and potentially mitigate the high care costs associated with AD.
Methods
In this section, the authors describe the datasets and methodologies employed to evaluate the performance of their proposed models for multiclass classification of Alzheimer’s disease using MRI images. The dataset, sourced from Kaggle, consists of images categorized into four groups: mild dementia (896 images), moderate dementia (64 images), non-demented (3200 images), and very mild dementia (2240 images). To address the significant class imbalance, the authors enhanced the dataset by adjusting the blur and sharpness of the original images, resulting in a revised dataset with 8700 images for mild dementia, 7200 for moderate dementia, 9600 for non-demented, and 8900 for very mild dementia.
The computational framework utilized for model training and evaluation is specified, featuring a Windows 10 operating system, an NVIDIA Quadro GV100 graphics card, and an Intel Xeon Gold 6134 CPU. The models were implemented using the Keras library with TensorFlow as the backend, optimized for AI-enhanced design and visualization tasks. This methodological approach aims to ensure robust performance in classifying the various stages of Alzheimer’s disease based on MRI data.
Results
In this section, the results of testing various deep learning models for classifying Alzheimer’s disease stages are presented. The study utilized the ResNet-50 and DenseNet-169 architectures, with DenseNet-169 achieving superior performance, recording training and testing accuracies of 97.7% and 83.82%, respectively, compared to ResNet-50’s 88.70% and 81.92%. A customized deep neural network (DNN) was also developed, yielding an accuracy of 82% on the original dataset and 89% on the augmented dataset.
The proposed models incorporated feature extraction and reduction techniques, with the first hybrid model (ResNet as feature extractor and extra-tree classifier as feature reducer) achieving a training accuracy of 96.30% and a validation accuracy of 91.76%. The introduction of dropout regularization improved validation accuracy to 92.61% while reducing the gap between training and validation accuracies. The second hybrid model using DenseNet yielded similar results, with training accuracy at 97.74% and validation accuracy at 89.77% with dropout. The third model, utilizing Xception, showed lower performance metrics. Overall, the proposed models, particularly the one using ResNet, demonstrated enhanced accuracy and reduced overfitting compared to the baseline model from Al Shheri [26].
Discussion
In this section, the authors present a comprehensive discussion of their proposed hybrid deep learning and machine learning (DL-ML) models aimed at addressing data imbalance in a multiclass classification task using an Alzheimer’s dataset. The methodology involves a multi-step approach: initially, images are augmented through blurring and sharpening techniques to enhance dataset diversity. Subsequently, features are extracted using pre-trained convolutional neural networks (CNNs) such as ResNet, DenseNet, and Xception, which leverage transfer learning to improve model performance while reducing training time. The extracted features are then processed through an Extra Tree classifier for dimensionality reduction before being fed into a customized deep neural network (DNN) for classification.
The authors highlight the effectiveness of their models, reporting a maximum validation accuracy of 92.61% with the ResNet-based architecture. They also emphasize the importance of performance metrics such as accuracy, precision, recall, and F1-score, particularly in the context of unbalanced datasets, where macro-averaging is employed to ensure equitable evaluation across classes. The proposed framework not only addresses the challenges of data scarcity and imbalance but also demonstrates the potential of hybrid models in enhancing diagnostic capabilities for neurodegenerative disorders.
