تطوير نموذج مبتكر لاكتشاف سرطان الرئة للتشخيص الدقيق في أنظمة الرعاية الصحية المعتمدة على الذكاء الاصطناعي Developing an innovative lung cancer detection model for accurate diagnosis in AI healthcare systems

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-03960-2
PMID: https://pubmed.ncbi.nlm.nih.gov/40592932
تاريخ النشر: 2025-07-02
المؤلف: Jian Wang وآخرون
الموضوع الرئيسي: كشف وتصنيف أورام الدماغ

نظرة عامة

تقدم البحث نموذج تعلم عميق متكامل جديد، يُشار إليه باسم CNN-GRU، يهدف إلى تعزيز دقة الكشف عن سرطان الرئة (LC) ضمن أنظمة الرعاية الصحية المعتمدة على الذكاء الاصطناعي. يجمع هذا النموذج بين الشبكات العصبية التلافيفية (CNNs) لاستخراج الميزات المكانية من صور الأشعة المقطعية للرئة ووحدات التكرار المغلقة (GRUs) للتنبؤ النهائي. تعالج الشبكة العصبية التلافيفية الصور من خلال طبقات التلافيف والتجميع، بينما تستخدم GRU الميزات المستخرجة لإجراء التنبؤات. تم التحقق من صحة النموذج باستخدام تقنية التحقق من الصحة الاحتياطية، محققًا دقة مثيرة للإعجاب تبلغ 99.77%، متفوقًا بشكل كبير على النماذج السابقة.

لتحسين أداء النموذج، تم استخدام تقنيات زيادة البيانات مثل التدوير وتعديلات السطوع، إلى جانب خوارزميات التحسين مثل الانحدار العشوائي (SGD) وتقدير اللحظة التكيفية (ADAM) خلال التدريب. يبرز الدراسة أهمية الكشف المبكر عن سرطان الرئة، وهو أمر حاسم للعلاج الفعال، ويبرز إمكانيات نموذج CNN-GRU كأداة موثوقة في أنظمة الرعاية الصحية المعتمدة على الذكاء الاصطناعي. ستركز الأعمال المستقبلية على دمج التعلم بالنقل، والتعلم الفيدرالي، وطرق زيادة البيانات المتقدمة لتعزيز قدرات النموذج التشخيصية بشكل أكبر.

طرق

في هذه الدراسة، استخدم المؤلفون مجموعتين رئيسيتين من البيانات للتحقق من صحة النموذج: مجموعة بيانات سرطان الرئة IQ-OTH/NCCD ومجموعة بيانات صور الأشعة المقطعية. تتكون مجموعة بيانات IQ-OTH/NCCD من 1,097 صورة أشعة مقطعية مصنفة إلى ثلاث فئات: 561 خبيثة، 120 حميدة، و416 طبيعية. تم التحقق من أداء النموذج بشكل إضافي باستخدام مجموعة بيانات أشعة مقطعية منفصلة تحتوي على 364 صورة، مقسمة بالتساوي بين الحالات السرطانية وغير السرطانية.

شملت المنهجية التجريبية تنفيذ نموذج CNN-GRU، حيث تم تطبيق تقنيات زيادة البيانات المختلفة، بما في ذلك التدوير وتعديلات السطوع، لعمليات المعالجة المسبقة. تم تقسيم مجموعة البيانات إلى 80% للتدريب و20% للاختبار، مع استخدام التحقق المتقاطع الاحتياطي. تم ضبط المعلمات الفائقة مثل حجم الدفعة (32، 64، و120)، وعدد الدورات (30، 50، و60)، ومعدلات التعلم (0.0001 و0.001) يدويًا لتعزيز أداء النموذج، إلى جانب معدل تسرب قدره 0.2 لتخفيف الإفراط في التكيف. تم إجراء التجارب باستخدام بايثون مع TensorFlow وKeras على نظام مزود بمعالج Intel® Core™ i5-2400 وذاكرة RAM سعة 4 جيجابايت، مما يضمن الإبلاغ عن النتائج المستقرة فقط من التجارب المتكررة.

نتائج

تظهر نتائج الدراسة فعالية نماذج التعلم العميق المختلفة في تصنيف صور سرطان الرئة من مجموعة بيانات IQ-OTH/NCCD. في البداية، كانت مجموعة البيانات تتكون من 1,097 صورة مع اختلالات في الفئات، والتي تم معالجتها من خلال تقنيات زيادة البيانات، مما أدى إلى مجموعة بيانات متوازنة من 1,683 صورة. تم تقييم نموذج الشبكة العصبية التلافيفية (CNN) على كل من مجموعات البيانات الأصلية والمزودة، محققًا مقاييس أداء ملحوظة. على وجه التحديد، مع المحسن SGD، حقق CNN دقة تبلغ 96.12%، بينما حقق المحسن ADAM دقة تبلغ 96.89%. على مجموعة البيانات المزودة، حسّن CNN أدائه بشكل أكبر، محققًا دقة تبلغ 97.02% مع ADAM.

كما أظهر نموذج الوحدة التكرارية المغلقة (GRU) نتائج قوية، مع دقتين تبلغان 97.00% و98.23% لمجموعة البيانات الأصلية باستخدام المحسنين SGD وADAM، على التوالي. على مجموعة البيانات المزودة، حقق GRU دقة تبلغ 98.97% مع المحسن ADAM. تفوق نموذج CNN-GRU الهجين المقترح على كلا النموذجين الفرديين، محققًا دقة تبلغ 99.12% مع المحسن ADAM على مجموعة البيانات الأصلية و99.77% على مجموعة البيانات المزودة. تشير هذه النتائج إلى أن دمج هياكل CNN وGRU، جنبًا إلى جنب مع زيادة البيانات الفعالة، يعزز بشكل كبير أداء التصنيف، مما يظهر إمكانيات النموذج للتعميم عبر مجموعات بيانات مختلفة.

نقاش

تؤكد قسم النقاش في ورقة البحث على التحدي الحاسم المتمثل في تشخيص سرطان الرئة (LC) بدقة باستخدام الطرق التقليدية، التي غالبًا ما تفشل في تقديم نتائج موثوقة وفي الوقت المناسب. لمعالجة هذه المشكلة، يقترح المؤلفون نموذج تعلم عميق متكامل يجمع بين الشبكات العصبية التلافيفية (CNNs) ووحدات التكرار المغلقة (GRUs) لتعزيز الكشف عن LC. يتفوق مكون CNN في استخراج الميزات المكانية من صور الأشعة المقطعية، بينما تلتقط GRU العلاقات الزمنية عبر عدة مسحات، مما يحسن قدرة النموذج على تحديد الأنماط الدقيقة التي تشير إلى نمو الورم. حقق نموذج CNN-GRU المقترح دقة مثيرة للإعجاب تبلغ 99.77%، متفوقًا على النماذج الأساسية، وأظهر حساسية وخصوصية عالية، مما يجعله أداة واعدة لأنظمة الرعاية الصحية المعتمدة على الذكاء الاصطناعي.

على الرغم من دقته العالية، فإن تعقيد النموذج يطرح تحديات، بما في ذلك الحاجة إلى مجموعات بيانات كبيرة ومنظمة جيدًا وموارد حسابية كبيرة. يعترف المؤلفون بالقيود مثل الإفراط المحتمل في التكيف وتأثير تباين الصور على التعميم. يقترحون أن تستكشف الأبحاث المستقبلية تقنيات متقدمة مثل التعلم بالنقل، ودمج البيانات متعددة الأنماط، وطرق زيادة البيانات المتطورة لتعزيز مرونة النموذج وقابليته للتفسير. يعد معالجة هذه التحديات أمرًا ضروريًا للتكامل الناجح للذكاء الاصطناعي في الرعاية الصحية، بهدف تحسين نتائج المرضى من خلال أدوات تشخيص سرطان الرئة الأكثر موثوقية وقابلية للتوسع.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-03960-2
PMID: https://pubmed.ncbi.nlm.nih.gov/40592932
Publication Date: 2025-07-02
Author(s): Jian Wang et al.
Primary Topic: Brain Tumor Detection and Classification

Overview

The research presents a novel integrated deep learning model, referred to as CNN-GRU, aimed at enhancing the accuracy of lung cancer (LC) detection within AI-based healthcare systems. This model combines Convolutional Neural Networks (CNNs) for spatial feature extraction from lung CT images with Gated Recurrent Units (GRUs) for final prediction. The CNN processes the images through convolutional and pooling layers, while the GRU utilizes the extracted features to make predictions. The model was validated using a holdout validation technique, achieving an impressive accuracy of 99.77%, significantly outperforming previous models.

To optimize the model’s performance, data augmentation techniques such as rotation and brightness adjustments were employed, alongside optimization algorithms like Stochastic Gradient Descent (SGD) and Adaptive Moment Estimation (ADAM) during training. The study underscores the importance of early detection of lung cancer, which is critical for effective treatment, and highlights the potential of the CNN-GRU model as a reliable tool in AI-based healthcare systems. Future work will focus on incorporating transfer learning, federated learning, and advanced data augmentation methods to further enhance the model’s diagnostic capabilities.

Methods

In this study, the authors utilized two primary datasets for model validation: the IQ-OTH/NCCD lung cancer dataset and a CT-Scan image dataset. The IQ-OTH/NCCD dataset comprises 1,097 CT scan images classified into three categories: 561 malignant, 120 benign, and 416 normal. The model’s performance was further validated using a separate CT-Scan dataset containing 364 images, evenly split between cancerous and non-cancerous cases.

The experimental methodology involved implementing a CNN-GRU model, where various data augmentation techniques, including rotation and brightness adjustments, were applied for preprocessing. The dataset was partitioned into 80% for training and 20% for testing, employing holdout cross-validation. Hyperparameters such as batch size (32, 64, and 120), epochs (30, 50, and 60), and learning rates (0.0001 and 0.001) were manually adjusted to enhance model performance, alongside a dropout rate of 0.2 to mitigate overfitting. The experiments were conducted using Python with TensorFlow and Keras on a system equipped with an Intel® Core™ i5-2400 CPU and 4 GB of RAM, ensuring that only stable results from repeated trials were reported.

Results

The results of the study demonstrate the effectiveness of various deep learning models in classifying lung cancer images from the IQ-OTH/NCCD dataset. Initially, the dataset comprised 1,097 images with class imbalances, which were addressed through data augmentation techniques, resulting in a balanced dataset of 1,683 images. The convolutional neural network (CNN) model was evaluated on both the original and augmented datasets, achieving notable performance metrics. Specifically, with the SGD optimizer, the CNN attained an accuracy of 96.12%, while the ADAM optimizer yielded an accuracy of 96.89%. On the augmented dataset, the CNN further improved its performance, achieving an accuracy of 97.02% with ADAM.

The gated recurrent unit (GRU) model also demonstrated strong results, with accuracies of 97.00% and 98.23% for the original dataset using SGD and ADAM optimizers, respectively. On the augmented dataset, the GRU achieved an accuracy of 98.97% with the ADAM optimizer. The proposed hybrid CNN-GRU model outperformed both individual models, achieving an accuracy of 99.12% with the ADAM optimizer on the original dataset and 99.77% on the augmented dataset. These results indicate that the integration of CNN and GRU architectures, combined with effective data augmentation, significantly enhances classification performance, showcasing the model’s potential for generalization across different datasets.

Discussion

The discussion section of the research paper emphasizes the critical challenge of accurately diagnosing lung cancer (LC) using traditional methods, which often fall short in providing timely and reliable results. To address this issue, the authors propose an integrated deep learning model combining Convolutional Neural Networks (CNNs) and Gated Recurrent Units (GRUs) for enhanced LC detection. The CNN component excels in extracting spatial features from CT scan images, while the GRU captures temporal relationships across multiple scans, thereby improving the model’s ability to identify subtle patterns indicative of tumor growth. The proposed CNN-GRU model achieved an impressive accuracy of 99.77%, outperforming baseline models, and demonstrated high specificity and sensitivity, making it a promising tool for AI-based healthcare systems.

Despite its high accuracy, the model’s complexity poses challenges, including the need for large, well-structured datasets and significant computational resources. The authors acknowledge limitations such as potential overfitting and the impact of image variability on generalization. They suggest that future research should explore advanced techniques like transfer learning, multi-modal data fusion, and sophisticated data augmentation methods to enhance model resilience and interpretability. Addressing these challenges is essential for the successful integration of AI in healthcare, ultimately aiming to improve patient outcomes through more reliable and scalable lung cancer diagnostic tools.