DOI: https://doi.org/10.1186/s44147-025-00654-4
تاريخ النشر: 2025-07-15
المؤلف: Zhenyun Du وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في الرعاية الصحية
نظرة عامة
تتناول البحث تحدي التعرف بدقة على أمراض القلب والأوعية الدموية (CVD) قبل حدوث النوبات القلبية، مع تسليط الضوء على قيود خوارزميات التنبؤ الحالية بسبب منهجياتها غير الكافية وتقنيات التعامل مع البيانات. للتغلب على هذه التحديات، يقترح المؤلفون نهجًا جديدًا للتعلم العميق (DL) باستخدام MobileNetV3 لتصنيف CVD. تشمل المنهجية مرحلة شاملة من المعالجة المسبقة التي تدير البيانات المفقودة، وتكتشف القيم الشاذة، وتقوم بتطبيع البيانات باستخدام تطبيع الحد الأدنى-الحد الأقصى، وترميز البيانات الفئوية، وإجراء التحولات. يتم استخراج الميزات باستخدام نموذج EfficientNetV2، تليها عملية اختيار الميزات من خلال خوارزمية البحث عن الزواحف (RSA).
يظهر نموذج MobileNetV3 المقترح أداءً مثيرًا للإعجاب، حيث يحقق دقة تصل إلى 99.82% و99.73% على مجموعتي بيانات UCI لأمراض القلب وFramingham، على التوالي. تشير النتائج إلى أن هذا النهج لا يتجاوز تقنيات التعلم التقليدية في دقة التصنيف فحسب، بل يظهر أيضًا تقليلًا في التعقيد الحسابي. يقترح المؤلفون أن العمل المستقبلي سيستكشف استراتيجيات دمج واختيار الميزات المختلفة لتعزيز دقة التنبؤ بأمراض القلب والأوعية الدموية في مجموعات البيانات عالية الأبعاد.
مقدمة
تناقش مقدمة ورقة البحث أمراض القلب والأوعية الدموية (CVD)، وهو مصطلح مرتبط بشكل أساسي بتصلب الشرايين ولكنه يشمل أي مرض يؤثر على نظام القلب والأوعية الدموية. تعتبر CVD قضية صحية عالمية هامة، حيث تقدر منظمة الصحة العالمية أنها تؤدي إلى حوالي 12 مليون وفاة سنويًا. إن التشخيص والعلاج الفعالين لـ CVD أمران حاسمان، مما يتطلب تقييمات طبية سريعة ودقيقة. يؤكد المؤلفون على الحاجة إلى الأتمتة في أنظمة التشخيص الطبي لتعزيز اتخاذ القرار وتكييف النماذج، مما يحسن نتائج المرضى.
تسلط الورقة الضوء على التحديات التي تطرحها عدم توازن الفئات في أساليب التعلم الآلي (ML) والتعلم العميق (DL) الحالية لتنبؤ CVD. غالبًا ما تتجاهل المنهجيات الحالية أهمية اختيار الميزات ودقة التصنيف، مما يؤدي إلى زيادة التعقيد الحسابي وعدم الجدوى في التطبيقات الواقعية. يدعو المؤلفون إلى إطار عمل متكامل للتعلم الآلي يقوم بتحسين اختيار الميزات ويعزز دقة التصنيف، بهدف تحسين التنبؤات بحالات القلب والأوعية الدموية مع تقليل المتطلبات الحسابية. يلاحظون ندرة مثل هذه الأطر الشاملة في البيئات السريرية والتجارية، مما يشير إلى تطوير طرق جديدة تعتمد على التعلم العميق لمعالجة هذه التحديات بشكل فعال.
الطرق
في هذه الدراسة، يقدم المؤلفون نهجًا جديدًا للتعلم العميق (DL) لتصنيف أمراض القلب والأوعية الدموية (CVD)، مع التركيز بشكل خاص على مرض الشريان التاجي (CAD)، وهو الشكل الأكثر شيوعًا من CVD. تبدأ المنهجية بمرحلة معالجة مسبقة شاملة تشمل تحويل البيانات، والتطبيع، وترميز البيانات الفئوية، والتعامل مع القيم المفقودة، واكتشاف القيم الشاذة.
بعد المعالجة المسبقة، يتم استخدام نموذج EfficientNetV2 لاستخراج الميزات ذات الصلة من مجموعة البيانات. لتعزيز عملية التصنيف، يتم اختيار السمات المهمة باستخدام الإزالة التكرارية للميزات (RSA) من الميزات المستخرجة. أخيرًا، يتم إجراء تصنيف أمراض القلب والأوعية الدموية باستخدام تقنية MobileNetV3، التي تم تصميمها لتلبية معايير محددة. يتم توضيح الهيكل العام للنموذج المقترح في الشكل 19.
النتائج
في قسم النتائج، يوضح المؤلفون إعداد التجربة، بما في ذلك المنصات الصلبة والبرمجية المستخدمة في الدراسة. كان الهدف الرئيسي هو استخدام سمات مجموعة البيانات لتنبؤ صحة قلوب المرضى. تكشف النتائج من البحث، كما تم مناقشته في الأقسام الفرعية التالية، عن رؤى مهمة حول القدرات التنبؤية للمنهجيات المستخدمة. تؤكد هذه النتائج على إمكانيات الأساليب المختارة في تقييم حالات القلب والأوعية الدموية.
المناقشة
يقدم البحث نهجًا جديدًا لتنبؤ أمراض القلب والأوعية الدموية (CVD) يدمج تقنيات معالجة البيانات المتقدمة، واختيار الميزات، ونماذج التعلم العميق. في البداية، تستخدم الدراسة طرقًا مثل اكتشاف القيم الشاذة، والتطبيع، وترميز البيانات الفئوية خلال مرحلة المعالجة المسبقة. يتم استخدام نموذج EfficientNetV2 لاستخراج الميزات، تليها خوارزمية البحث عن الزواحف (RSA) لاختيار الميزات المهمة. ثم يتم إجراء تصنيف CVD باستخدام بنية MobileNetV3. يتم تقييم الطريقة المقترحة على مجموعتين من البيانات: مجموعة بيانات أمراض القلب UCI ومجموعة بيانات Framingham، مما يظهر أداءً متفوقًا مقارنة بالنماذج الحالية.
تشير النتائج إلى أن الطريقة المقترحة تحقق معدلات دقة ملحوظة تصل إلى 99.82% على مجموعة بيانات UCI و99.73% على مجموعة بيانات Framingham، مع دقة عالية، واسترجاع، ودرجات F1. تعزز تقنية اختيار الميزات RSA أداء النموذج بشكل كبير من خلال التركيز على السمات الأكثر صلة، بينما تضمن بنية MobileNetV3 الكفاءة الحسابية والفعالية في التطبيقات الزمن الحقيقي. بالإضافة إلى ذلك، يظهر النموذج المقترح وقت تعقيد حسابي أقل (0.16 مللي ثانية) مقارنة بالطرق التقليدية، مما يجعله مناسبًا للبيئات السريرية حيث يكون اتخاذ القرار السريع أمرًا حاسمًا. بشكل عام، يبرز هذا البحث فعالية دمج التعلم العميق مع تقنيات اختيار الميزات القوية لتحسين دقة وموثوقية تنبؤ CVD.
القيود
يعرض النموذج المقترح عدة قيود قد تؤثر على فعاليته. بينما تشير الدراسة إلى أن مجموعة متنوعة من المصنفات قد أدت أداءً جيدًا مقارنة بالدراسات السابقة، فإن الاعتماد على طريقة واحدة لاختيار الميزات قد يحد من دقة النموذج. بالإضافة إلى ذلك، فإن وجود عدد كبير من القيم المفقودة داخل مجموعة البيانات يمثل تحديًا كبيرًا؛ إذا كانت هذه القيم المفقودة واسعة، فإنها تتطلب معالجة مشكلات مماثلة في مجموعات البيانات الأخرى المستخدمة بالتزامن مع هذا النهج.
علاوة على ذلك، على الرغم من الحجم الحالي لمجموعة بيانات التدريب، يمكن تعزيز دقة النموذج بشكل أكبر مع زيادة حجم البيانات. وهذا يشير إلى أن التكرارات المستقبلية للنموذج يجب أن تأخذ في الاعتبار دمج مجموعات بيانات أكثر شمولاً لتحسين القوة والموثوقية في النتائج.
DOI: https://doi.org/10.1186/s44147-025-00654-4
Publication Date: 2025-07-15
Author(s): Zhenyun Du et al.
Primary Topic: Artificial Intelligence in Healthcare
Overview
The research addresses the challenge of accurately identifying cardiovascular disease (CVD) prior to heart attacks, highlighting the limitations of existing prediction algorithms due to inadequate methodologies and data handling techniques. To overcome these challenges, the authors propose a novel Deep Learning (DL) approach utilizing MobileNetV3 for CVD classification. The methodology includes a comprehensive pre-processing phase that manages missing data, detects outliers, normalizes data using min-max normalization, encodes categorical data, and performs transformations. Feature extraction is conducted using the EfficientNetV2 model, followed by feature selection through the Reptile Search Algorithm (RSA).
The proposed MobileNetV3 model demonstrates impressive performance, achieving accuracies of 99.82% and 99.73% on the UCI Heart Disease and Framingham datasets, respectively. The findings indicate that this approach not only surpasses traditional learning techniques in classification accuracy but also exhibits reduced computational complexity. The authors suggest that future work will explore various feature fusion and selection strategies to further enhance prediction accuracy for CVD in high-dimensional datasets.
Introduction
The introduction of the research paper discusses cardiovascular disease (CVD), a term primarily associated with atherosclerosis but encompassing any ailment affecting the cardiovascular system. CVD is a significant global health concern, with the World Health Organization estimating that it results in approximately 12 million deaths annually. The effective diagnosis and treatment of CVD are critical, necessitating rapid and accurate medical assessments. The authors emphasize the need for automation in medical diagnosis systems to enhance decision-making and model adaptation, thereby improving patient outcomes.
The paper highlights the challenges posed by class imbalance in existing machine learning (ML) and deep learning (DL) approaches for predicting CVD. Current methodologies often neglect the importance of feature selection and classification accuracy, leading to increased computational complexity and impracticality in real-world applications. The authors advocate for an integrated ML framework that optimizes feature selection and enhances classification accuracy, aiming to improve predictions of cardiovascular conditions while minimizing computational demands. They note a scarcity of such comprehensive frameworks in clinical and commercial settings, suggesting the development of novel DL-based methods to address these challenges effectively.
Methods
In this study, the authors present a novel deep learning (DL) approach for the classification of cardiovascular diseases (CVD), specifically focusing on coronary artery disease (CAD), the most common form of CVD. The methodology begins with a comprehensive pre-processing stage that includes data transformation, normalization, encoding of categorical data, handling of missing values, and outlier detection.
Following pre-processing, the EfficientNetV2 model is employed to extract relevant features from the dataset. To enhance the classification process, significant attributes are selected using Recursive Feature Elimination (RSA) from the extracted features. Finally, the classification of cardiovascular diseases is performed using the MobileNetV3 technique, which is tailored to meet specific criteria. The overall structure of the proposed model is illustrated in Figure 19.
Results
In the Results section, the authors detail the experimental setup, including the hardware and software platforms employed for the study. The primary objective was to utilize the attributes of the dataset to predict patients’ heart health. The findings from the research, as discussed in the subsequent subsections, reveal significant insights into the predictive capabilities of the employed methodologies. These results underscore the potential of the chosen approaches in assessing cardiovascular conditions.
Discussion
The research presents a novel approach for cardiovascular disease (CVD) prediction that integrates advanced data preprocessing techniques, feature selection, and deep learning models. Initially, the study employs methods such as outlier detection, normalization, and categorical data encoding during the preprocessing phase. The EfficientNetV2 model is utilized for feature extraction, followed by the Reptile Search Algorithm (RSA) for selecting significant features. The classification of CVD is then performed using the MobileNetV3 architecture. The proposed method is evaluated on two datasets: the UCI heart disease dataset and the Framingham dataset, demonstrating superior performance compared to existing models.
The results indicate that the proposed method achieves remarkable accuracy rates of 99.82% on the UCI dataset and 99.73% on the Framingham dataset, with high precision, recall, and F1-scores. The RSA feature selection technique significantly enhances model performance by focusing on the most relevant attributes, while the MobileNetV3 architecture ensures computational efficiency and effectiveness in real-time applications. Additionally, the proposed model exhibits lower computational time complexity (0.16 ms) compared to traditional methods, making it suitable for clinical settings where rapid decision-making is crucial. Overall, this research underscores the effectiveness of combining deep learning with robust feature selection techniques for improving CVD prediction accuracy and reliability.
Limitations
The proposed model exhibits several limitations that could impact its effectiveness. While the research indicates that various classifiers have performed well relative to previous studies, reliance on a single feature selection method may restrict the model’s precision. Additionally, the presence of a substantial number of missing values within the dataset poses a significant challenge; if these missing values are extensive, it necessitates addressing similar issues in other datasets utilized in conjunction with this approach.
Moreover, despite the current size of the training dataset, the model’s accuracy could be further enhanced with an increased volume of data. This suggests that future iterations of the model should consider incorporating more comprehensive datasets to improve robustness and reliability in outcomes.
