تصنيف أورام الدماغ من صور الرنين المغناطيسي باستخدام شبكة عصبية متعددة القنوات مع دمج SVM
Brain tumor classification from MRI images using a multi-scale channel attention CNN integrated with SVM

المجلة: Scientific Reports، المجلد: 16، العدد: 1
DOI: https://doi.org/10.1038/s41598-026-36164-3
PMID: https://pubmed.ncbi.nlm.nih.gov/41593159
تاريخ النشر: 2026-01-27
المؤلف: Longzhang Ke وآخرون
الموضوع الرئيسي: كشف وتصنيف أورام الدماغ

نظرة عامة

تقدم ورقة البحث إطارًا هجينًا جديدًا لتصنيف أورام الدماغ من صور التصوير بالرنين المغناطيسي (MRI)، يُطلق عليه اسم شبكة CNN مع انتباه القناة متعددة المقاييس المدمجة مع آلة الدعم المتجهة (MCACNN-SVM). يعالج هذا الإطار قيود الشبكات العصبية التلافيفية التقليدية (CNNs) في استخراج الميزات من خلال استخدام نوى تلافيفية متعددة المقاييس وآلية انتباه القناة لتعزيز الميزات المكانية الهرمية. يتم إجراء التصنيف باستخدام آلة الدعم المتجهة (SVM) مع تحسين المعلمات الفائقة من خلال خوارزمية بحث الشبكة، ويتم استخدام استراتيجية تذويب جيب التمام مع إعادة التشغيل الدافئة لتحسين التقارب والتعميم. تشير النتائج التجريبية إلى أن نموذج MCACNN-SVM يحقق مقاييس أداء تنافسية، بما في ذلك الدقة، والدقة، والاسترجاع، ودرجة F1، مما يدل على القوة وقدرات التعميم للتطبيقات العملية.

تسلط الاستنتاجات الضوء على فعالية نموذج MCACNN-SVM في التغلب على التحديات المرتبطة بالأساليب ذات النموذج الواحد، مثل البيانات المحدودة والتكيف الزائد. من خلال دمج CNN لاستخراج الميزات وSVM لتعلم حدود القرار، يعزز النموذج القابلية للتفسير والتحسين. على الرغم من أدائه القوي عبر أربع فئات من أورام الدماغ، تعترف الدراسة بالقيود المتعلقة بالتعقيد الحسابي، وعدم توازن فئات مجموعة البيانات، وتدريب النموذج على شرائح MRI عالية الجودة ومعالجة مسبقًا من مصدر واحد. تشمل اتجاهات البحث المستقبلية تطوير نماذج خفيفة الوزن، وتوسيع جمع البيانات عبر مراكز وبروتوكولات متعددة، واستكشاف تقنيات متقدمة لتعلم عدم توازن الفئات. يؤكد المؤلفون على الحاجة إلى تحسين خوارزمي أعمق وتعليقات سريرية لتحسين دقة النموذج وقابليته للاستخدام في البيئات الطبية الواقعية.

مقدمة

تتناول مقدمة ورقة البحث هذه التحديات المرتبطة بالتصنيف الآلي لأورام الدماغ باستخدام التصوير بالرنين المغناطيسي (MRI). تسلط الضوء على تعقيد تشريح الدماغ والتنوع بين الأفراد، مما يعقد التشخيص اليدوي ويزيد من احتمال التحيز. بينما أظهرت الشبكات العصبية التلافيفية التقليدية (CNNs) وعدًا في هذا المجال، إلا أنها غالبًا ما تكافح لالتقاط ميزات شاملة وتحديد حدود قرار مثالية. وبالتالي، هناك حاجة ملحة إلى أطر تشخيصية مدعومة بالكمبيوتر متقدمة تكون قوية ودقيقة.

تقترح الورقة نموذجًا هجينًا جديدًا، يُسمى شبكة CNN مع انتباه القناة متعددة المقاييس المدمجة مع آلة الدعم المتجهة (MCACNN-SVM)، والذي يجمع بين قدرات استخراج الميزات لشبكة CNN متعددة المقاييس وكفاءة التصنيف لآلة الدعم المتجهة (SVM). يتضمن هذا النموذج آلية انتباه القناة لتعزيز قنوات الميزات الحرجة، مما يحسن دقة التصنيف وقوته. بالإضافة إلى ذلك، يستخدم استراتيجية تحسين شاملة، بما في ذلك تعديل معدل التعلم بتذويب جيب التمام وضبط المعلمات الفائقة بشكل منهجي لـ SVM. تظهر النتائج التجريبية على مجموعة بيانات التصوير بالرنين المغناطيسي لأورام الدماغ أن نموذج MCACNN-SVM يتجاوز الأساليب الحالية الرائدة في مختلف مقاييس الأداء، مما يبرز إمكاناته للتطبيقات التشخيصية السريرية.

طرق

في هذا القسم، يوضح المؤلفون إعداد التجارب وطرق معالجة البيانات المستخدمة لتقييم نموذج MCACNN-SVM لتصنيف أورام الدماغ. تم إجراء التجارب باستخدام إطار التعلم العميق Keras على تكوين الأجهزة الذي يتميز بمعالج Intel i7-13700KF ووحدة معالجة الرسومات Colorful GeForce RTX 4060 Ti، باستخدام CUDA 10.1 للتسريع على نظام تشغيل Windows 11.

استخدمت الدراسة مجموعة بيانات التصوير بالرنين المغناطيسي لأورام الدماغ، والتي تتكون من 7,023 شريحة MRI معززة بالتباين من الحالات السريرية في المستشفيات الصينية. يتم تصنيف هذه المجموعة إلى أربع فئات: الورم الدبقي، ورم السحايا، ورم الغدة النخامية، وعدم وجود ورم، مما يسهل مهمة تصنيف متعددة الفئات متوازنة. لتعزيز تعميم النموذج وتقليل التكيف الزائد، تم تطبيق خط أنابيب شامل لمعالجة البيانات وزيادتها على مجموعة التدريب، بما في ذلك التطبيع إلى حجم 224 × 224 بكسل وإعادة قياس قيم البكسل إلى النطاق [0، 1]. تم تنفيذ تقنيات زيادة البيانات في الوقت الحقيقي، مثل الدوران العشوائي (±15°)، والانقلاب الأفقي العشوائي (احتمالية 50%)، والتكبير العشوائي (±10%)، وتطبيع التدرج الرمادي، أثناء التدريب. في المقابل، خضعت مجموعات التحقق والاختبار فقط لإعادة القياس والتطبيع لضمان تقييم عادل لأداء النموذج.

نتائج

يقدم قسم النتائج تقييمًا شاملاً لأداء نموذج MCACNN-SVM في تصنيف أورام الدماغ باستخدام نهج تصنيف من أربع فئات. تشير مصفوفة الالتباس (الشكل 10) إلى أن النموذج يحقق دقة تصنيف عالية تبلغ 96.9% على مجموعة الاختبار، مما يدل على قدرته القوية على التعميم في التمييز بين أنواع الأورام المختلفة والأنسجة الطبيعية. من الجدير بالذكر أن معدل الاسترجاع لورم السحايا هو 90.79%، وهو أقل من الفئات الأخرى، على الأرجح بسبب حجم عينة أصغر في مجموعة بيانات التدريب. توضح منحنيات ROC (الشكل 11) أداء النموذج الاستثنائي، حيث تتجاوز قيم AUC 0.99 لجميع الفئات وتصل إلى 1.00 لكل من فئتي “عدم وجود ورم” و”الغدة النخامية”، مما يشير إلى أخطاء طفيفة في التصنيف.

بالإضافة إلى ذلك، يناقش القسم تحليلًا مقارنًا لنموذج MCACNN-SVM مقابل عدة هياكل CNN المعروفة، بما في ذلك VGG16 وResNet18 وDenseNet121 وEfficientNet، بالإضافة إلى نموذج MSCNN. تم ضبط جميع النماذج تحت ظروف متطابقة لضمان مقارنة عادلة. تساهم إضافة آلية انتباه القناة (SENet) واستخدام مقاييس التقييم المتوسطة الكلية، مثل درجة F1 المتوسطة وAUC، في أداء النموذج القوي، خاصة في معالجة عدم توازن الفئات وتعزيز التقييم العام لقدرات التصنيف.

مناقشة

في قسم المناقشة من الورقة، يستكشف المؤلفون النظريات الأساسية التي تدعم خوارزميات تصنيف الصور، مع التركيز بشكل خاص على الشبكات العصبية التلافيفية (CNNs) وآلات الدعم المتجهة (SVMs). يتم تسليط الضوء على CNNs لقدرتها على تعلم الميزات الهرمية تلقائيًا من الصور، مما يعزز أدائها في مهام مثل التعرف على الصور. ومع ذلك، يشير المؤلفون إلى القيود المرتبطة بهياكل CNN الأعمق، بما في ذلك مشكلات مثل تلاشي التدرجات وحقول الاستقبال المحدودة التي تعيق معالجة الصور الكبيرة. لمعالجة هذه التحديات، تقدم الورقة آلية انتباه القناة، وهي شبكة الضغط والتحفيز (SENet)، التي تحسن استخراج الميزات من خلال إعادة ضبط استجابات القناة ديناميكيًا. تعزز هذه الآلية قدرة النموذج على التركيز على الميزات الحرجة في الصور المعقدة، مثل أورام الدماغ، مع الحفاظ على تعقيد حسابي أقل.

يجمع نموذج MCACNN-SVM المقترح بين طبقات تلافيفية متعددة المقاييس مع SVM للتصنيف، مما يعزز قدرة النموذج على التقاط الميزات على مقاييس مختلفة. يستخدم الهيكل مسارات تلافيفية متوازية بأحجام نوى مختلفة لاستخراج ميزات مكانية مفصلة، والتي تتم معالجتها بعد ذلك بواسطة SVM لتحديد حد قرار قوي. يؤكد المؤلفون على أهمية ضبط المعلمات الفائقة لكل من مكونات CNN وSVM، باستخدام تقنيات مثل GridSearchCV وآلية إعادة التشغيل الدافئة لمعدل التعلم لتحسين أداء النموذج. تشير النتائج إلى أن نموذج MCACNN-SVM يتفوق على CNNs التقليدية وغيرها من النماذج المقارنة من حيث دقة التصنيف والكفاءة، مما يدل على فعاليته في مهام تصنيف صور أورام الدماغ.

Journal: Scientific Reports, Volume: 16, Issue: 1
DOI: https://doi.org/10.1038/s41598-026-36164-3
PMID: https://pubmed.ncbi.nlm.nih.gov/41593159
Publication Date: 2026-01-27
Author(s): Longzhang Ke et al.
Primary Topic: Brain Tumor Detection and Classification

Overview

The research paper presents a novel hybrid framework for brain tumor classification from Magnetic Resonance Imaging (MRI) images, termed multi-scale channel attention CNN integrated with support vector machine (MCACNN-SVM). This framework addresses the limitations of traditional convolutional neural networks (CNNs) in feature extraction by utilizing multi-scale convolutional kernels and a channel attention mechanism to enhance hierarchical spatial features. The classification is performed using a support vector machine (SVM) with hyperparameters optimized through a grid search algorithm, and a cosine annealing strategy with warm restarts is employed to improve convergence and generalization. Experimental results indicate that the MCACNN-SVM model achieves competitive performance metrics, including accuracy, precision, recall, and F1-score, demonstrating robustness and generalization capabilities for practical applications.

The conclusions highlight the effectiveness of the MCACNN-SVM model in overcoming challenges associated with single-model approaches, such as limited data and overfitting. By integrating CNN for feature extraction and SVM for decision boundary learning, the model enhances interpretability and optimization. Despite its strong performance across four brain tumor categories, the study acknowledges limitations related to computational complexity, dataset class imbalances, and the model’s training on high-quality, preprocessed MRI slices from a single source. Future research directions include developing lightweight models, expanding data collection across multiple centers and protocols, and exploring advanced techniques for class imbalance learning. The authors emphasize the need for deeper algorithmic optimization and clinical feedback to improve the model’s accuracy and usability in real-world medical settings.

Introduction

The introduction of this research paper addresses the challenges associated with the automated classification of brain tumors using Magnetic Resonance Imaging (MRI). It highlights the complexity of the brain’s anatomy and the variability among subjects, which complicate manual diagnoses and increase the likelihood of subjectivity. While traditional convolutional neural networks (CNNs) have shown promise in this domain, they often struggle to capture comprehensive features and establish optimal decision boundaries. Consequently, there is a pressing need for advanced computer-aided diagnostic frameworks that are both robust and accurate.

The paper proposes a novel hybrid model, named multi-scale channel attention CNN integrated with support vector machine (MCACNN-SVM), which combines the feature extraction capabilities of a multi-scale CNN with the classification efficiency of a support vector machine (SVM). This model incorporates a channel attention mechanism to enhance critical feature channels, thereby improving classification accuracy and robustness. Additionally, it employs a comprehensive optimization strategy, including a cosine annealing learning rate adjustment and systematic hyperparameter tuning for the SVM. Experimental results on the Brain Tumor MRI Dataset demonstrate that the MCACNN-SVM model surpasses existing state-of-the-art methods in various performance metrics, underscoring its potential for clinical diagnostic applications.

Methods

In this section, the authors detail the experimental setup and data preprocessing methods employed to evaluate the MCACNN-SVM model for brain tumor classification. The experiments were conducted using the Keras deep learning framework on a hardware configuration featuring an Intel i7-13700KF CPU and a Colorful GeForce RTX 4060 Ti GPU, utilizing CUDA 10.1 for acceleration on a Windows 11 operating system.

The study utilized the Brain Tumor MRI Dataset, which consists of 7,023 T1-weighted contrast-enhanced MRI slices sourced from clinical cases in Chinese hospitals. This dataset is categorized into four classes: glioma, meningioma, pituitary tumor, and no tumor, facilitating a balanced multi-class classification task. To enhance model generalization and reduce overfitting, a comprehensive data preprocessing and augmentation pipeline was applied to the training set, including normalization to a size of 224 × 224 pixels and pixel value rescaling to the range [0, 1]. Real-time data augmentation techniques, such as random rotation (±15°), random horizontal flip (50% probability), random zoom (±10%), and grayscale normalization, were implemented during training. In contrast, the validation and test sets underwent only resizing and normalization to ensure a fair evaluation of the model’s performance.

Results

The results section presents a comprehensive evaluation of the MCACNN-SVM model’s performance in classifying brain tumors using a four-class classification approach. The confusion matrix (Figure 10) indicates that the model achieves a high classification accuracy of 96.9% on the test set, demonstrating its strong generalization ability in distinguishing between different tumor types and normal tissue. Notably, the recall rate for meningioma is 90.79%, which is lower than other categories, likely due to its smaller sample size in the training dataset. The ROC curves (Figure 11) further illustrate the model’s exceptional performance, with AUC values exceeding 0.99 for all categories and reaching 1.00 for both the “no tumor” and “pituitary” classes, indicating minimal errors in classification.

Additionally, the section discusses a comparative analysis of the MCACNN-SVM model against several established CNN architectures, including VGG16, ResNet18, DenseNet121, and EfficientNet, as well as the MSCNN model. All models were fine-tuned under identical conditions to ensure a fair comparison. The incorporation of a channel attention mechanism (SENet) and the use of macro-averaged evaluation metrics, such as Macro F1-score and AUC, contribute to the model’s robust performance, particularly in addressing class imbalances and enhancing the overall assessment of classification capabilities.

Discussion

In the discussion section of the paper, the authors explore the foundational theories underpinning image classification algorithms, particularly focusing on Convolutional Neural Networks (CNNs) and Support Vector Machines (SVMs). CNNs are highlighted for their ability to automatically learn hierarchical features from images, which enhances their performance in tasks such as image recognition. However, the authors note limitations associated with deeper CNN architectures, including issues like vanishing gradients and restricted receptive fields that hinder the processing of large images. To address these challenges, the paper introduces a channel attention mechanism, specifically the Squeeze-and-Excitation Network (SENet), which optimizes feature extraction by dynamically recalibrating channel-wise responses. This mechanism improves the model’s ability to focus on critical features in complex images, such as brain tumors, while maintaining lower computational complexity.

The proposed MCACNN-SVM model integrates multi-scale convolutional layers with SVM for classification, enhancing the model’s capability to capture features at various scales. The architecture employs parallel convolutional pathways with different kernel sizes to extract detailed spatial features, which are then processed by SVM to establish a robust decision boundary. The authors emphasize the importance of hyperparameter tuning for both the CNN and SVM components, utilizing techniques like GridSearchCV and a warm restart mechanism for the learning rate to optimize model performance. The results indicate that the MCACNN-SVM model outperforms traditional CNNs and other comparative models in terms of classification accuracy and efficiency, demonstrating its effectiveness for brain tumor image classification tasks.