DOI: https://doi.org/10.1038/s41598-024-51867-1
PMID: https://pubmed.ncbi.nlm.nih.gov/38233516
تاريخ النشر: 2024-01-17
المؤلف: Rezuana Haque وآخرون
الموضوع الرئيسي: كشف وتصنيف أورام الدماغ
نظرة عامة
تقدم ورقة البحث NeuroNet19، وهي بنية شبكة عصبية عميقة مصممة لاكتشاف وتصنيف أورام الدماغ (BTs). من خلال الاستفادة من VGG19 كعمود فقري لها، تتضمن NeuroNet19 وحدة تجميع الهرم المقلوب (iPPM) لالتقاط خرائط الميزات متعددة المقاييس بفعالية، مما يعزز قدرة النموذج على استخراج كل من السياقات المحلية والعالمية للصورة بغض النظر عن حجم الورم أو موقعه. يتم تدريب النموذج على مجموعة بيانات تتكون من 7,023 صورة عبر أربع فئات من أورام الدماغ: الدبقية، السحائية، لا ورم، وأورام الغدة النخامية. تحقق NeuroNet19 دقة مثيرة للإعجاب تبلغ 99.3%، مع دقة واسترجاع كلاهما عند 99.2%، ودرجة F1 تبلغ 99.3%، ومعامل كابا كوهين يبلغ 99%، مما يوضح فعاليتها في تحديد أورام الدماغ بدقة.
بالإضافة إلى أدائها العالي، تؤكد NeuroNet19 على الشفافية من خلال استخدام تفسيرات نموذجية محلية قابلة للتفسير (LIME)، التي توضح الميزات التي تؤثر على التنبؤات الفردية. بينما يظهر النموذج كفاءة ملحوظة، إلا أنه محدود بأربعة أنواع من الأورام التي تم تدريبه عليها، مما يتطلب مزيدًا من التدريب لتصنيفات إضافية. تهدف الأبحاث المستقبلية إلى توسيع مجموعة البيانات، وتعزيز قدرة النموذج على التكيف مع سيناريوهات سريرية متنوعة، وتحسين تطبيقه على الأشعة المقطعية. كما يُخطط لتطوير منصة قائمة على الويب لـ NeuroNet19، بهدف زيادة الوصول للمهنيين الطبيين وتسهيل النشر العالمي والتحسين المستمر للنموذج من خلال التعلم الفيدرالي.
الطرق
في هذا القسم، يتم تفصيل المنهجية لتدريب وتقييم نموذج NeuroNet19. تبدأ العملية بمعالجة الصور الخام باستخدام تقنيات مثل تشويش غاوسي، وعتبة أوتسو، واكتشاف الحدود لتعزيز استخراج الميزات. ثم يتم تقسيم الصور إلى مجموعات تدريب، وتحقق، واختبار، مع تطبيق زيادة البيانات بشكل حصري على مجموعة التدريب لتحسين التنوع ومنع الإفراط في التكيف. تستخدم بنية النموذج VGG19 لاستخراج الميزات، تليها وحدة iPPM للتصنيف المحسن. تشمل مقاييس التقييم الدقة، والدقة، والاسترجاع، ودرجة F1، ومعامل كابا كوهين (CKC)، التي تقيم مجتمعة أداء النموذج التنبؤي.
تستفيد الإعدادات التجريبية من وحدة معالجة الرسوميات Tesla T4 من Google Colab وتستخدم استراتيجية التحقق المتقاطع ثلاثي الطيات. تكشف دراسة الإزالة أن التكوين الأمثل لـ NeuroNet19 يتضمن استخدام مُحسّن آدم بمعدل تعلم يبلغ 0.00001 والتدريب على مدى 50 حقبة، مما يحقق مقاييس أداء متفوقة. تشير النتائج إلى أن دمج زيادة البيانات والأوزان المدربة مسبقًا يعزز بشكل كبير دقة النموذج وموثوقيته، مع تسجيل أفضل مقاييس الأداء عند 99.3% دقة، و99.2% دقة، و99.2% استرجاع. توضح تحليل خرائط الميزات فهمًا هرميًا لميزات الصورة، بينما تُظهر منحنى ROC المتوسط الدقيق فعالية النموذج في التمييز بين أنواع الأورام وحالات عدم الورم، محققة قيمة منطقة تحت المنحنى (AUC) تبلغ 1، مما يدل على قدرة تصنيف ممتازة.
المناقشة
تسلط قسم المناقشة في ورقة البحث الضوء على التكامل المبتكر لبنية VGG19 مع وحدة تجميع الهرم المقلوب (iPPM) في نموذج NeuroNet19 المقترح، مما يمثل تقدمًا كبيرًا في تصنيف أورام الدماغ (BT) من صور الرنين المغناطيسي. يعزز هذا الجمع من قدرات استخراج الميزات، مما يسمح بتحليل أكثر دقة لصور الرنين المغناطيسي، وهو أمر حاسم للتشخيص الدقيق والتدخلات الطبية في الوقت المناسب. تلتقط العمود الفقري VGG19 ميزات هرمية معقدة، بينما تقوم iPPM بتنقيح هذه الميزات من خلال المعالجة متعددة المقاييس، مما يحسن قدرة النموذج على تحديد وتصنيف أنواع مختلفة من أورام الدماغ.
تؤكد مراجعة الأدبيات على أهمية الكشف المبكر عن أورام الدماغ ودور تقنيات التعلم العميق المتقدمة في هذا المجال. يتم الإشارة إلى عدة دراسات، تعرض نماذج مختلفة ومقاييس أدائها، مثل نموذج تجميعي يحقق دقة 98% ونموذج EfficientNet المعدل يصل إلى دقة تحقق تبلغ 98.87%. توضح هذه النتائج المشهد التنافسي لأساليب الكشف عن أورام الدماغ، مما يبرز الحاجة إلى الابتكار المستمر. يهدف نموذج NeuroNet19، مع بنيته الفريدة، إلى المساهمة في هذا المجال من خلال توفير إطار عمل قوي لتصنيف أورام الدماغ، مستفيدًا من نقاط القوة لكل من VGG19 وiPPM لتعزيز دقة التشخيص ونتائج المرضى.
DOI: https://doi.org/10.1038/s41598-024-51867-1
PMID: https://pubmed.ncbi.nlm.nih.gov/38233516
Publication Date: 2024-01-17
Author(s): Rezuana Haque et al.
Primary Topic: Brain Tumor Detection and Classification
Overview
The research paper presents NeuroNet19, a deep neural network architecture designed for the detection and classification of brain tumors (BTs). Leveraging VGG19 as its backbone, NeuroNet19 incorporates the Inverted Pyramid Pooling Module (iPPM) to effectively capture multi-scale feature maps, enhancing the model’s ability to extract both local and global image contexts regardless of tumor size or position. The model is trained on a dataset of 7,023 images across four BT classes: glioma, meningioma, no tumor, and pituitary tumors. NeuroNet19 achieves an impressive accuracy of 99.3%, with precision and recall both at 99.2%, an F1 score of 99.3%, and a Cohen Kappa coefficient of 99%, demonstrating its efficacy in accurately identifying BTs.
In addition to its high performance, NeuroNet19 emphasizes transparency through the use of Local Interpretable Model-Agnostic Explanations (LIME), which elucidates the features influencing individual predictions. While the model shows remarkable proficiency, it is limited to the four tumor types it was trained on, necessitating further training for additional classifications. Future research aims to expand the dataset, enhance the model’s adaptability to various clinical scenarios, and improve its application to CT scans. The development of a web-based platform for NeuroNet19 is also planned, aiming to increase accessibility for medical professionals and facilitate the global dissemination and continuous improvement of the model through federated learning.
Methods
In this section, the methodology for training and evaluating the NeuroNet19 model is detailed. The process begins with preprocessing raw images using techniques such as Gaussian blur, Otsu’s thresholding, and contour finding to enhance feature extraction. The images are then divided into training, validation, and testing subsets, with data augmentation applied exclusively to the training set to improve diversity and prevent overfitting. The model architecture utilizes VGG19 for feature extraction, followed by an iPPM module for refined classification. Evaluation metrics include accuracy, precision, recall, F1-score, and Cohen’s Kappa coefficient (CKC), which collectively assess the model’s predictive performance.
The experimental setup leverages Google Colab’s Tesla T4 GPU and employs a 3-fold cross-validation strategy. An ablation study reveals that the optimal configuration for NeuroNet19 involves using the Adam optimizer with a learning rate of 0.00001 and training over 50 epochs, achieving superior performance metrics. The results indicate that incorporating data augmentation and pre-trained weights significantly enhances model accuracy and robustness, with the best performance metrics recorded at 99.3% accuracy, 99.2% precision, and 99.2% recall. The analysis of feature maps illustrates a hierarchical understanding of image features, while the micro-average ROC curve demonstrates the model’s efficacy in distinguishing between tumor types and non-tumor cases, achieving an area under the curve (AUC) value of 1, indicating excellent classification capability.
Discussion
The discussion section of the research paper highlights the innovative integration of the VGG19 architecture with the Inverted Pyramid Pooling Module (iPPM) in the proposed NeuroNet19 model, marking a significant advancement in brain tumor (BT) classification from MRI images. This combination enhances feature extraction capabilities, allowing for a more nuanced analysis of MRI scans, which is critical for accurate diagnosis and timely medical interventions. The VGG19 backbone captures complex hierarchical features, while the iPPM refines these features through multi-scale processing, thereby improving the model’s ability to identify and classify various types of brain tumors.
The literature review underscores the importance of early BT detection and the role of advanced deep learning techniques in this domain. Several studies are referenced, showcasing various models and their performance metrics, such as an ensemble model achieving 98% accuracy and a fine-tuned EfficientNet model reaching 98.87% validation accuracy. These findings illustrate the competitive landscape of BT detection methodologies, emphasizing the need for continuous innovation. The NeuroNet19 model, with its unique architecture, aims to contribute to this field by providing a robust framework for BT classification, leveraging the strengths of both VGG19 and iPPM to enhance diagnostic accuracy and patient outcomes.
