تشخيص سرطان الثدي باستخدام MFF-HistoNet: شبكة دمج ميزات متعددة الأنماط تجمع بين الشبكات العصبية التلافيفية وشبكات التنسور الكمومية
Breast cancer diagnosis with MFF-HistoNet: a multi-modal feature fusion network integrating CNNs and quantum tensor networks

المجلة: Journal Of Big Data، المجلد: 12، العدد: 1
DOI: https://doi.org/10.1186/s40537-025-01114-9
تاريخ النشر: 2025-03-07
المؤلف: Tariq Mahmood وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في اكتشاف السرطان

نظرة عامة

تقدم ورقة البحث شبكة دمج ميزات متعددة الأنماط جديدة لتشخيص الأمراض النسيجية (MFF-HistoNet) تهدف إلى تعزيز دقة وكفاءة تشخيص سرطان الثدي من خلال تقنية التشخيص المدعوم بالكمبيوتر (CAD). تحدد الدراسة القيود في الخوارزميات الحالية، مثل عدد المعلمات المرتفع والاستخراج غير الفعال للميزات العالمية، مما قد يؤدي إلى فقدان المعلومات. تدمج MFF-HistoNet شبكة عصبية تلافيفية (CNN) مع شبكة موتر كمومية (QTN) لتقليل تعقيد النموذج مع التقاط العلاقات المكانية بفعالية في الصور النسيجية. يستخدم النموذج استراتيجية تعزيز البيانات لتحقيق توازن في مجموعة التدريب وتقليل تداخل الألوان، ويستخدم مزيجًا من مصفوفة التكرار لمستوى الرمادي (GLCM)، وأنماط ثنائية محلية (LBP)، وتصفية غابور لاستخراج خصائص شكل الخلايا المحلية.

تظهر النتائج أن MFF-HistoNet تحقق دقة تشخيصية تبلغ 98.8% على مستوى الصورة و98.9% على مستوى المريض تحت تكبير 100×، متفوقة بشكل كبير على النماذج الحالية. تؤكد طريقة Grad-CAM أيضًا موثوقية النموذج وأدائه. تسلط هذه الدراسة الضوء على إمكانيات تقنيات معالجة الصور المتقدمة، بما في ذلك مفاهيم الحوسبة الكمومية، في تحسين التشخيصات النسيجية الآلية، مما يقلل من الاعتماد على الطرق التقليدية المعرضة للأخطاء. الشيفرات الخاصة بالنموذج المقترح متاحة للجمهور، مما يعزز المزيد من البحث في هذا المجال الواعد.

مقدمة

تتناول مقدمة ورقة البحث القضية الحرجة لسرطان الثدي، وهو مرض يتميز بالنمو غير المنضبط للخلايا الظهارية في الثدي، ويؤثر بشكل أساسي على النساء، اللاتي يمثلن الغالبية العظمى من الحالات. وفقًا لاستطلاع أجري في عام 2020 من قبل المركز العالمي لأبحاث السرطان، يعد سرطان الثدي أكثر أنواع السرطان انتشارًا في جميع أنحاء العالم، حيث يمثل 11.7% من الحالات الجديدة، متجاوزًا سرطان الرئة. يحدث ذروة الإصابة في النساء اللواتي تتراوح أعمارهن بين 45 و55 عامًا، مما يبرز الحاجة إلى زيادة الوعي والفحص المنتظم بين الفئات العمرية الأصغر لتسهيل الكشف المبكر وتحسين نتائج العلاج.

تؤكد الورقة على أهمية التصوير الطبي، وخاصة صور علم الأمراض النسيجية لسرطان الثدي، للتشخيص، على الرغم من الطبيعة المرهقة لإجراءات الخزعة. تناقش دور أنظمة التشخيص المدعوم بالكمبيوتر (CAD) في تعزيز كفاءة وموثوقية التقييمات المرضية. تقدم الدراسة خوارزمية جديدة، MFF-HistoNet، التي تدمج الشبكات العصبية التلافيفية (CNNs) مع شبكة موتر كمومية (QTN) وطرق استخراج ميزات النسيج التقليدية مثل مصفوفة التكرار لمستوى الرمادي (GLCM)، ونمط ثنائي محلي (LBP)، وتصفية غابور. تهدف هذه الطريقة إلى تحسين دقة تشخيص سرطان الثدي وتصنيفه من خلال تقليل معلمات النموذج وتعزيز جودة الصورة، مما يحافظ على المعلومات الحيوية أثناء التحليل.

طرق

في هذا القسم، يصف المؤلفون المنهجية المستخدمة في بحثهم، مع التركيز بشكل خاص على تطوير نموذج شبكة MFF-HistoNet لفحص التصوير الطبي. تم بناء النموذج باستخدام إطار عمل Pytorch ضمن بيئة Python، مع الاستفادة من أدوات البرمجيات مثل PyCharm وAnaconda لتعزيز الوظائف.

تم دعم إعداد التجربة من خلال تكوين أجهزة قوي، يتميز بمعالج Intel Core i7-10700 و32 جيجابايت من الذاكرة العشوائية، مما يسهل الأداء الحاسوبي الفعال. تم إنشاء بيئة البرمجيات على نظام تشغيل Windows 10 بعمق 64 بت، مع إصدار Python 3.8 ومجموعة Anaconda3، مما يضمن منصة مستقرة لإجراء التجارب والحصول على نتائج موثوقة.

نتائج

يقدم قسم النتائج تحليلًا لمصفوفات الالتباس لمهمة تصنيف من ثمانية فئات، مع التركيز على كل من الصور الأصلية والصور المعدلة لونيًا. بالنسبة للصور الأصلية، حقق النموذج معدل تمييز مرتفع لفئة PC بدقة 95%، بينما أظهرت الفئات A وF دقة أقل بلغت 63% و77%، على التوالي. ومن الجدير بالذكر أن فئة DC كانت لديها أعلى دقة بلغت 98%، على الرغم من وجود تصنيف خاطئ كبير بين DC وLC، مما يشير إلى تشابه في الميزات التي تعقد التمييز بين هذه الفئات الخبيثة.

في تحليل الصور المعدلة لونيًا، حققت الفئات A وPT تمييزًا بنسبة 100%، لكن التصنيفات الخاطئة استمرت بين DC وLC، وكذلك بين LC وDC. وهذا يشير إلى التحديات المستمرة في تمييز الميزات ضمن هذه الفئات. ومع ذلك، على مستوى المريض، انخفض معدل التصنيف الخاطئ بين DC وLC بشكل كبير مقارنة بمستوى الصورة، وهو ما يُعزى إلى طرق تقسيم مجموعة البيانات المختلفة. بشكل عام، يظهر النموذج أداءً قويًا وتمييزًا فعالًا عبر ثماني فئات لكل من الصور الأصلية والمعدلة لونيًا.

مناقشة

في قسم المناقشة من ورقة البحث، يقوم المؤلفون بتقييم نقدي لقيود طرق تشخيص سرطان الثدي التقليدية، بما في ذلك الماموجرام، والأشعة فوق الصوتية، والتصوير بالرنين المغناطيسي. يعتبر الماموجرام، على الرغم من فعاليته في الكشف عن التكلسات، أقل موثوقية بالنسبة لأنسجة الثدي الكثيفة، التي تنتشر بين بعض الفئات السكانية، مثل النساء الصينيات. يمكن للأشعة فوق الصوتية التمييز بين الكتل الحميدة والخبيثة، لكنها تواجه صعوبة مع الكتل الأقل وضوحًا ورؤية العقد اللمفاوية. يعتبر التصوير بالرنين المغناطيسي، على الرغم من حساسيته العالية وقدرته على اكتشاف الآفات الصغيرة، مكلفًا ومعقدًا، مما يجعله غير عملي للفحص على نطاق واسع. يبرز المؤلفون الطبيعة المستهلكة للموارد للتصوير النسيجي، الذي لا يزال هو المعيار الذهبي ولكنه يعاني من الحاجة إلى موظفين مهرة وإجراءات تستغرق وقتًا طويلاً.

لمعالجة هذه النواقص، تقدم الدراسة بنية MFF-HistoNet، التي تدمج ميزات شبكة موتر كمومية (QTN) مع الشبكات العصبية التلافيفية (CNN) لتعزيز استخراج الميزات وتقليل تعقيد النموذج. لا تحسن هذه الطريقة المبتكرة دقة التصنيف عبر أنواع سرطان الثدي المختلفة فحسب، بل تدير أيضًا عدم توازن مجموعة البيانات بفعالية من خلال تقنيات تعزيز البيانات وتعديل الألوان. يظهر النموذج المقترح أداءً متفوقًا مقارنة بالطرق الحالية، محققًا معدلات دقة عالية عند تكبيرات متعددة ويظهر إمكانياته للتطبيق السريري في التشخيص النسيجي الآلي. يؤكد المؤلفون على أهمية تطوير تقنيات التعلم الآلي لتحسين كفاءة وموثوقية تشخيص سرطان الثدي، مما يمهد الطريق لمزيد من الأبحاث في هذا المجال الحيوي.

Journal: Journal Of Big Data, Volume: 12, Issue: 1
DOI: https://doi.org/10.1186/s40537-025-01114-9
Publication Date: 2025-03-07
Author(s): Tariq Mahmood et al.
Primary Topic: AI in cancer detection

Overview

The research paper presents a novel Multi-Modal Feature Fusion Network for Histopathology (MFF-HistoNet) aimed at enhancing the accuracy and efficiency of breast cancer diagnosis through computer-aided diagnosis (CAD) technology. The study identifies limitations in existing algorithms, such as high parameter counts and ineffective global feature extraction, which can lead to information loss. MFF-HistoNet integrates a Convolutional Neural Network (CNN) with a Quantum Tensor Network (QTN) to reduce model complexity while effectively capturing spatial relationships in histopathological images. The model employs a data enhancement strategy to balance the training set and minimize color interference, and it utilizes a combination of Gray Level Co-occurrence Matrix (GLCM), Local Binary Patterns (LBP), and Gabor filtering to extract local cell shape characteristics.

The results demonstrate that MFF-HistoNet achieves a diagnostic accuracy of 98.8% at the image level and 98.9% at the patient level under 100× magnification, significantly outperforming existing models. The Grad-CAM method further validates the model’s reliability and performance. This study underscores the potential of advanced image processing techniques, including quantum computing concepts, in improving automated histopathological diagnostics, thereby reducing reliance on traditional, error-prone methods. The proposed model’s codes are publicly accessible, promoting further research in this promising area.

Introduction

The introduction of the research paper addresses the critical issue of breast cancer, a disease marked by the uncontrolled growth of epithelial cells in the breast, primarily affecting women, who represent the vast majority of cases. According to a 2020 survey by the Global Cancer Research Center, breast cancer is the most prevalent cancer worldwide, accounting for 11.7% of new cases, surpassing lung cancer. The peak incidence occurs in women aged 45 to 55, highlighting the need for increased awareness and regular screening among younger populations to facilitate early detection and improve treatment outcomes.

The paper emphasizes the importance of medical imaging, particularly breast cancer tissue pathology images, for diagnosis, despite the cumbersome nature of biopsy procedures. It discusses the role of Computer-Aided Diagnosis (CAD) systems in enhancing the efficiency and reliability of pathological assessments. The study introduces a novel algorithm, MFF-HistoNet, which integrates Convolutional Neural Networks (CNNs) with a Quantized Tensor Network (QTN) and traditional texture feature extraction methods like Gray-Level Co-occurrence Matrix (GLCM), Local Binary Pattern (LBP), and Gabor filtering. This approach aims to improve the accuracy of breast cancer diagnosis and grading by reducing model parameters and enhancing image quality, thereby preserving critical information during analysis.

Methods

In this section, the authors describe the methodology employed in their research, specifically focusing on the development of the MFF-HistoNet network model for medical imaging screening. The model was constructed using the Pytorch framework within a Python environment, utilizing software tools such as PyCharm and Anaconda for enhanced functionality.

The experimental setup was supported by a robust hardware configuration, featuring an Intel Core i7-10700 CPU and 32 GB of RAM, which facilitated efficient computational performance. The software environment was established on a 64-bit Windows 10 operating system, with Python version 3.8 and the Anaconda3 suite, ensuring a stable platform for conducting experiments and obtaining reliable results.

Results

The results section presents an analysis of confusion matrices for an eight-class classification task, focusing on both original and color-normalized images. For the original images, the model achieved a high distinction rate for the category PC at 95% accuracy, while categories A and F exhibited lower accuracies of 63% and 77%, respectively. Notably, the category DC had the highest accuracy at 98%, although there was significant misclassification between DC and LC, indicating a similarity in features that complicates discrimination between these malignant subcategories.

In the analysis of color-normalized images, categories A and PT achieved 100% distinction, but misclassifications persisted between DC and LC, as well as between LC and DC. This suggests ongoing challenges in feature differentiation within these categories. However, at the patient level, the misclassification rate between DC and LC significantly decreased compared to the image level, attributed to different dataset division methods. Overall, the model demonstrates robust performance and effective discrimination across eight categories for both original and color-normalized images.

Discussion

In the discussion section of the research paper, the authors critically evaluate the limitations of conventional breast cancer diagnostic methods, including mammography, ultrasound, and MRI. Mammography, while effective for detecting calcifications, is less reliable for dense breast tissues, which are prevalent among certain populations, such as Chinese women. Ultrasound can differentiate between benign and malignant masses but struggles with less apparent lumps and lymph node visualization. MRI, although highly sensitive and capable of detecting small lesions, is costly and complex, making it impractical for large-scale screening. The authors highlight the resource-intensive nature of histopathological imaging, which remains the gold standard but is hampered by the need for skilled personnel and time-consuming procedures.

To address these deficiencies, the study introduces the MFF-HistoNet architecture, which integrates Quantum Tensor Network (QTN) features with Convolutional Neural Networks (CNN) to enhance feature extraction and reduce model complexity. This innovative approach not only improves classification accuracy across various breast cancer subtypes but also effectively manages dataset imbalances through data augmentation and color normalization techniques. The proposed model demonstrates superior performance compared to existing methods, achieving high accuracy rates at multiple magnifications and showcasing its potential for clinical application in automated histopathological diagnosis. The authors emphasize the importance of advancing machine learning techniques to improve the efficiency and reliability of breast cancer diagnostics, paving the way for future research in this critical area.