DOI: https://doi.org/10.1038/s41598-024-51438-4
PMID: https://pubmed.ncbi.nlm.nih.gov/38378741
تاريخ النشر: 2024-02-20
المؤلف: Abeer El-Sayyid El-Bashbishy وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في الرعاية الصحية
نظرة عامة
تقدم هذه البحث تقنية جديدة في التعلم العميق للتنبؤ المبكر بالسكري، محققة معدل دقة مثير للإعجاب يبلغ 99.8%. تم بناء النموذج باستخدام شبكة عصبية عميقة (DNN) تعتمد على بنية متعددة الطبقات (MLP)، تضم عشرة طبقات مخفية وضبط شامل للمعلمات. استخدمت الدراسة مجموعة بيانات من مستشفى أطفال جامعة المنصورة للسكري (MUCHD)، تتكون من 548 مريضًا أطفال و18 ميزة هامة. تم استخدام مقاييس تحقق مختلفة، بما في ذلك الدقة، وF-score، والدقة، والحساسية، والخصوصية، ومعامل تشابه Dice، لضمان موثوقية النتائج، مما يظهر تحسينًا في الأداء بنسبة 0.39% مقارنة بالطرق الحالية المتطورة.
يعمل النظام المقترح على معالجة البيانات بفعالية من خلال تنظيفها وإدخال القيم المفقودة، تليها مراحل التدريب والتقييم. تم استخدام وظيفتين للتفعيل، ReLU وSigmoid، مما ساهم في أداء النموذج عبر مقاييس جودة متعددة مثل متوسط الخطأ التربيعي وR² Score. تشير النتائج إلى أن هذا النهج في التعلم العميق لا يعزز فقط دقة التنبؤ بالسكري ولكن يساعد أيضًا في اتخاذ القرارات السريرية للمرضى الصغار. يُقترح العمل المستقبلي لتحسين الدقة من خلال مجموعات بيانات أكبر واستكشاف دمج التصوير الطبي الإضافي والبيانات الحيوية السريرية لتعزيز قدرات النظام التشخيصية بشكل أكبر.
الطرق
في هذا القسم، يحدد المؤلفون طريقة لتصنيف الأمراض تستخدم نهج التعلم المراقب، مستفيدين من دورة تدريب واختبار لتصنيف المرضى بناءً على سماتهم الطبية. تم تصميم النموذج لمعالجة التحديات المرتبطة بمجموعات البيانات عالية الأبعاد، وخاصة وجود ميزات غير ذات صلة يمكن أن تؤثر سلبًا على أداء التصنيف. للتخفيف من هذه المشكلات، تم تنفيذ خطوة معالجة مسبقة، تتضمن تطوير خوارزمية تصنيف الفتحة المستندة إلى الإحصاءات ونظرية التحكم.
تم هيكلة النموذج المقترح في ثلاث طبقات: طبقة إدخال تستقبل سبعة عشر ميزة بيانات خام، وبنية شبكة عصبية عميقة (DNN) مع عشرة طبقات مخفية، وطبقة إخراج تنتج نتائج تصنيف ثنائية. يقوم كل خلية عصبية في الطبقات المخفية بمعالجة ميزات الإدخال، التي يتم تهيئتها بأوزان تتراوح من 0 إلى 1. يتم ضبط النموذج من خلال تعديل المعلمات مثل الأوزان والانحيازات لتعزيز دقة التنبؤ. تشمل المنهجية عدة مراحل، بما في ذلك جمع البيانات، والمعالجة المسبقة، والتصنيف، والتدريب/الاختبار، والتقييم، والتحسين، والتنبؤ، مع التركيز على استخدام مجموعة بيانات MUCHD. تشمل خطوات المعالجة المسبقة الرئيسية معالجة القيم المفقودة وتقييس الميزات لضمان نتائج تصنيف موثوقة. تهدف الطريقة المنهجية إلى تحسين الكفاءة في تصنيف الأمراض الطبية، مع التركيز بشكل خاص على السكري بناءً على السجلات الطبية المقدمة.
النتائج
تؤكد نتائج هذه الدراسة على أهمية الكشف المبكر عن السكري وفعالية نموذج شبكة عصبية عميقة (DNN) تم تطويره باستخدام مجموعة بيانات MUCHD من مستشفى أطفال جامعة المنصورة. تتكون مجموعة البيانات من 548 عينة مع 18 ميزة، بما في ذلك المؤشرات الديموغرافية والسريرية، مصنفة إلى 151 مريض غير مصاب بالسكري (الفئة 0) و397 مريض مصاب بالسكري (الفئة 1). خضع نموذج DNN لعملية صارمة من خمس مراحل تتضمن معالجة البيانات، والتطبيع، وإدخال القيم المفقودة، وضبط المعلمات، وتقسيم مجموعة البيانات إلى مجموعات تدريب (70%) واختبار (30%). تم حساب مقاييس الأداء مثل الدقة، والدقة، والاسترجاع، وF1-Score، وغيرها باستخدام معادلات مثبتة، مع تصور النتائج في الأشكال والجداول المرفقة.
تشير نتائج الدراسة إلى أن نموذج DNN المقترح يتفوق على الطرق الحالية في الأدبيات، خاصة في تشخيص السكري لدى الأطفال، وهي فئة ديموغرافية غالبًا ما يتم تجاهلها في الأبحاث السابقة التي تركز بشكل أساسي على البالغين. تشمل مزايا النموذج نهجه التشخيصي الشامل، ومرونته لمختلف الأمراض، وكفاءته في استخدام الموارد من خلال بنية مدربة مسبقًا. أسفر ضبط المعلمات عن تكوينات مثالية، بما في ذلك حجم دفعة قدره 10، و50 دورة، ووظائف تفعيل محددة، مما يعزز قدرات النموذج التنبؤية. بشكل عام، يقدم هذا البحث تقدمًا كبيرًا في تطبيق DNNs للكشف المبكر عن السكري لدى الأطفال، مما يبرز إمكانياته لتطبيقات طبية أوسع.
المناقشة
تسلط قسم المناقشة في ورقة البحث الضوء على خوارزميات التعلم العميق (DL) المختلفة المطبقة على مجموعة بيانات السكري للهنود البيما (PID)، التي تحتوي على تسعة سمات و768 سجلًا للمرضى الإناث. تشمل النتائج الملحوظة استخدام الشبكات العصبية التلافيفية (CNN)، والشبكات العصبية العميقة (DBN)، والشبكات العصبية العميقة (DNN)، والبيرسيبترونات متعددة الطبقات (MLP)، حيث حققت CNN المدمجة مع أجهزة التشفير التلقائية النادرة (SAE) دقة مثيرة للإعجاب تبلغ 98.1%. استكشفت دراسات أخرى تقنيات تعلم الآلة (ML) المختلفة، مثل آلات الدعم الشعاعي (SVM) والانحدار اللوجستي (LR)، مع درجات متفاوتة من النجاح، مما يدل على أهمية اختيار الخوارزمية وزيادة الميزات في تحسين دقة التنبؤ.
تشدد الدراسة على أهمية جودة البيانات والمعالجة المسبقة في أداء النموذج، خاصة في التعامل مع القيم المفقودة وضمان تقييس الميزات بشكل صحيح. يستخدم النموذج المقترح مجموعة بيانات MUCHD، التي تشمل 548 سجلًا للأطفال مع 18 سمة، لتصنيف السكري في مجموعة سكانية أكثر تنوعًا. توضح الورقة خطوات المعالجة المسبقة، بما في ذلك التطبيع واختيار الميزات باستخدام ارتباط بيرسون، لتعزيز موثوقية النموذج. تم بناء بنية DNN مع عدة طبقات مخفية وتستخدم وظائف تفعيل مثل ReLU وSigmoid، مع تحسين المعلمات من خلال تقنيات مثل التحقق المتقاطع K-fold لضمان تقييم قوي وتعميم النموذج. بشكل عام، تؤكد النتائج على الدور الحاسم لسلامة البيانات واستراتيجيات الخوارزمية في تحقيق دقة تصنيف عالية في التنبؤ بالسكري.
DOI: https://doi.org/10.1038/s41598-024-51438-4
PMID: https://pubmed.ncbi.nlm.nih.gov/38378741
Publication Date: 2024-02-20
Author(s): Abeer El-Sayyid El-Bashbishy et al.
Primary Topic: Artificial Intelligence in Healthcare
Overview
This research presents a novel deep learning technique for early diabetes prediction, achieving an impressive accuracy rate of 99.8%. The model is built using a Deep Neural Network (DNN) based on a multi-layer perceptron (MLP) architecture, incorporating ten hidden layers and extensive hyperparameter tuning. The study utilized a dataset from Mansoura University Children’s Hospital Diabetes (MUCHD), comprising 548 pediatric patients and 18 significant features. Various validation metrics, including accuracy, F-score, precision, sensitivity, specificity, and the Dice similarity coefficient, were employed to ensure the reliability of the results, demonstrating a 0.39% performance improvement over existing state-of-the-art methods.
The proposed system effectively preprocesses data by cleaning and imputing missing values, followed by training and evaluation phases. Two activation functions, ReLU and Sigmoid, were utilized, contributing to the model’s performance across multiple quality measures such as Mean Squared Error and R² Score. The findings indicate that this deep learning approach not only enhances diabetes prediction accuracy but also aids in clinical decision-making for young patients. Future work is suggested to improve accuracy through larger datasets and to explore the integration of additional medical imaging and clinical biomarkers to further enhance the system’s diagnostic capabilities.
Methods
In this section, the authors outline a method for disease classification that employs a supervised learning approach, utilizing a train-and-test cycle to categorize patients based on their medical attributes. The model is designed to address challenges associated with high-dimensional datasets, particularly the presence of irrelevant features that can degrade classification performance. To mitigate these issues, a preprocessing step is implemented, which includes the development of an aperture classification algorithm informed by statistics and control theory.
The proposed model is structured into three layers: an input layer that receives seventeen raw data features, a deep neural network (DNN) architecture with ten hidden layers, and an output layer that produces binary classification results. Each neuron in the hidden layers processes the input features, which are initialized with weights ranging from 0 to 1. The model is fine-tuned through the adjustment of parameters such as weights and biases to enhance prediction accuracy. The methodology encompasses several phases, including data collection, preprocessing, classification, training/testing, evaluation, optimization, and prediction, with a focus on utilizing the MUCHD dataset. Key preprocessing steps involve addressing missing values and scaling features to ensure reliable classification outcomes. The systematic approach aims to improve efficiency in medical disease classification, specifically targeting diabetes based on the provided medical records.
Results
The results of this study emphasize the importance of early diabetes detection and the effectiveness of a Deep Neural Network (DNN) model developed using the MUCHD dataset from Mansoura University Children’s Hospital. The dataset comprises 548 samples with 18 features, including demographic and clinical indicators, categorized into 151 non-diabetic (class 0) and 397 diabetic patients (class 1). The DNN model underwent a rigorous five-phase process involving data preprocessing, normalization, missing value imputation, hyperparameter tuning, and dataset partitioning into training (70%) and testing (30%) sets. Performance metrics such as Accuracy, Precision, Recall, F1-Score, and others were calculated using established equations, with results visualized in accompanying figures and tables.
The study’s findings indicate that the proposed DNN model outperforms existing methods in the literature, particularly in diagnosing pediatric diabetes, a demographic often overlooked in previous research predominantly focused on adults. The model’s advantages include its comprehensive diagnostic approach, versatility for various diseases, and efficiency in resource utilization through a pre-trained architecture. The hyperparameter tuning yielded optimal configurations, including a batch size of 10, 50 epochs, and specific activation functions, enhancing the model’s predictive capabilities. Overall, this research presents a significant advancement in the application of DNNs for early diabetes detection in children, highlighting its potential for broader medical applications.
Discussion
The discussion section of the research paper highlights various deep learning (DL) algorithms applied to the Pima Indian diabetes (PID) dataset, which contains nine attributes and 768 records of female patients. Notable findings include the use of Convolutional Neural Networks (CNN), Deep Belief Networks (DBN), Deep Neural Networks (DNN), and Multi-Layer Perceptrons (MLP), with CNN combined with Sparse Auto Encoders (SAE) achieving an impressive accuracy of 98.1%. Other studies explored different machine learning (ML) techniques, such as Support Vector Machines (SVM) and Logistic Regression (LR), with varying degrees of success, indicating the importance of algorithm selection and feature augmentation in improving predictive accuracy.
The research emphasizes the significance of data quality and preprocessing in model performance, particularly in handling missing values and ensuring proper feature scaling. The proposed model utilizes the MUCHD dataset, which includes 548 pediatric records with 18 attributes, to classify diabetes in a more diverse population. The paper details the preprocessing steps, including normalization and feature selection using Pearson’s correlation, to enhance model reliability. The DNN architecture is constructed with multiple hidden layers and employs activation functions like ReLU and Sigmoid, optimizing hyperparameters through techniques such as K-fold cross-validation to ensure robust evaluation and generalization of the model. Overall, the findings underscore the critical role of data integrity and algorithmic strategies in achieving high classification accuracy in diabetes prediction.
