DOI: https://doi.org/10.1007/s00784-025-06156-0
PMID: https://pubmed.ncbi.nlm.nih.gov/39888441
تاريخ النشر: 2025-01-31
المؤلف: Fatmanur Ketenci وآخرون
الموضوع الرئيسي: الأشعة السينية السنية والتصوير
نظرة عامة
هدفت هذه الدراسة إلى تقييم أداء نموذج DeepLabv3+ مقارنة بنموذج U-Net في اكتشاف وتقسيم الآفات القمية في الأشعة البانورامية. تم استخدام مجموعة بيانات تتكون من 260 صورة بانورامية مشروحة، حيث تم تطبيق كلا النموذجين تحت نفس المعلمات الفائقة. أظهرت النتائج أن DeepLabv3+ تفوق بشكل كبير على U-Net من حيث منطقة تحت المنحنى (AUC) والاسترجاع، محققًا تحسينات بنسبة 29.96% و61.06% على التوالي. على العكس، أظهر U-Net دقة متفوقة ودرجة F1، مع تحسينات بنسبة 69.17% و25.55%. أظهرت نتائج تقاطع الاتحاد (IoU) عدم وجود فرق ذو دلالة إحصائية بين النموذجين.
على الرغم من الأداء الواعد لـ DeepLabv3+، تسلط الدراسة الضوء على القيود بسبب حجم مجموعة البيانات الصغيرة، مما قد يعيق التطبيق السريري. يقترح المؤلفون أنه مع مجموعة بيانات أكبر وعمليات تدريب مصقولة، يمكن أن يعزز كلا النموذجين التشخيص السريري وتخطيط العلاج. تكشف المقارنات مع الدراسات السابقة أن أداء النموذج يمكن أن يختلف بشكل كبير بناءً على عوامل مثل حجم مجموعة البيانات، إعدادات المعلمات الفائقة، واستراتيجيات التقييم. بشكل عام، بينما يظهر DeepLabv3+ إمكانيات لتقسيم الآفات القمية، هناك حاجة لمزيد من التحسينات للتطبيق السريري.
مقدمة
تناقش المقدمة التهاب اللثة القمي، وهو حالة التهابية تؤثر على قمة جذر الأسنان، بشكل أساسي بسبب العدوى البكتيرية في اللب، والتي يمكن أن تؤدي إلى مضاعفات كبيرة إذا تم تشخيصها بشكل خاطئ. يتم التعرف على التهاب اللثة القمي شعاعياً من خلال الشفافية الشعاعية المحيطة بالقمة، وغالباً ما يكون من الصعب اكتشافها بسبب التعقيدات التشريحية وإمكانية التعب البصري بين أطباء الأسنان الذين يراجعون العديد من الصور. يمكن أن يؤدي ذلك إلى تقييمات غير مكتملة وتشخيصات خاطئة، مما يؤدي إلى نتائج خطيرة مثل الخراجات أو فقدان الأسنان. لمعالجة هذه التحديات، تسلط المقدمة الضوء على إمكانيات أدوات التشخيص المدعومة بالذكاء الاصطناعي، وخاصة في تقسيم الآفات القمية، مما يمكن أن يعزز دقة التشخيص وتخطيط العلاج.
تتوسع النصوص أكثر في نماذج الذكاء الاصطناعي المختلفة المستخدمة في التصوير الطبي، بما في ذلك U-Net وDeepLabv3+، مشيرة إلى أنه بينما كان U-Net هو التركيز الرئيسي لتقسيم الآفات القمية، لم يتم تطبيق DeepLabv3+ سابقًا في هذا السياق. تهدف الدراسة إلى مقارنة فعالية هذين النموذجين في تقسيم الآفات القمية بدقة، مع فرضية أن تحسين التقسيم يمكن أن يؤدي إلى تشخيصات في الوقت المناسب ونتائج أفضل للمرضى، مما يقلل في النهاية من تكاليف العلاج ويعزز الكفاءة السريرية.
الطرق
اتبعت هذه الدراسة إرشادات STROBE وحصلت على موافقة أخلاقية من لجنة أخلاقيات البحث السريري غير التدخلي في جامعة يديتيبي. تم إجراء البحث وفقًا لإعلان هلسنكي، وشمل تحليل الأشعة البانورامية المختارة عشوائيًا من أرشيفات كلية طب الأسنان. تم استخدام نظام Morita Veraviewepocs لالتقاط هذه الصور، مع إعداد معلمات محددة للتعرض. تم استبعاد الأشعة التي تحتوي على أسنان مختلطة أو مشاكل تقنية، مما أسفر عن مجموعة بيانات نهائية تتكون من 260 صورة مجهولة الهوية، تم شرحها بواسطة اثنين من أطباء الأشعة الأسنان ذوي الخبرة ومراجع رئيسي باستخدام أداة توضيح الرؤية الحاسوبية (CVAT).
تم تقسيم مجموعة البيانات إلى مجموعات تدريب واختبار باستخدام طريقة التحقق المتقاطع 5-fold، حيث تم تخصيص 208 صور للتدريب و52 للاختبار. استخدمت الدراسة نموذج DeepLabv3+ لتقسيم الآفات القمية، مستخدمةً بنية مشفرة-مفككة مع الالتفاف المتباعد والتعلم الانتقالي من ResNet50 لاستخراج الميزات. بالمقارنة، تم تقييم نموذج U-Net أيضًا تحت ظروف مماثلة. تم حساب مقاييس الأداء، بما في ذلك الدقة، والاسترجاع، ودرجة F1، وتقاطع الاتحاد (IoU)، لتقييم فعالية النموذج. أظهرت النتائج أن نموذج DeepLabv3+ تفوق على U-Net من حيث منطقة تحت المنحنى (AUC) والاسترجاع، بينما أظهر U-Net دقة متفوقة وIoU ودرجة F1. تؤكد النتائج فعالية هذه النماذج العميقة في مهام تقسيم الصور الطبية.
النتائج
يقدم قسم النتائج تقييمًا لأداء نموذج DeepLabv3+ في تقسيم الآفات القمية، باستخدام مقاييس الأداء المحددة. تشير النتائج إلى أن DeepLabv3+ تم مقارنته بنموذج U-Net، وهو معيار معروف على نطاق واسع في تقسيم الآفات القمية. لضمان تقييم عادل، تم تكوين كلا النموذجين بمعلمات فائقة متطابقة، كما هو موضح في الجدول 1. تسمح هذه الاتساق المنهجي بمقارنة موثوقة لقدرات تقسيم النموذجين.
المناقشة
في هذه الدراسة، تم مقارنة أداء نموذج DeepLabv3+ مع نموذج U-Net لتقسيم الآفات القمية. أشارت النتائج إلى أن DeepLabv3+ حقق تحسينات ذات دلالة إحصائية على U-Net من حيث منطقة تحت المنحنى (AUC) والاسترجاع، مع قيم p تبلغ 0.00065 و0.00125 على التوالي. على العكس، أظهر U-Net دقة متفوقة ودرجة F1، على الرغم من أن الفروق في مقاييس تقاطع الاتحاد (IoU) والاسترجاع لم تكن ذات دلالة إحصائية. تشير النتائج إلى أن DeepLabv3+ مفضل لالتقاط الآفات المحتملة، مما يعزز التشخيص المبكر، بينما يُفضل U-Net لتقليل الإيجابيات الكاذبة.
سلطت الدراسة أيضًا الضوء على قيود كلا النموذجين، بما في ذلك مجموعة البيانات الصغيرة المكونة من 260 صورة والتحديات المرتبطة بالتعليق الدقيق. أشار المؤلفون إلى أن الدراسات السابقة التي استخدمت تقنيات القص ومجموعات بيانات أكبر أبلغت عن مقاييس أداء أفضل، مما يبرز أهمية هذه العوامل في تدريب النموذج. يجب أن تركز الأبحاث المستقبلية على مجموعات بيانات أكبر وأكثر تنوعًا واستكشاف هياكل التعلم العميق البديلة لتحسين دقة التقسيم. بشكل عام، بينما يظهر DeepLabv3+ وU-Net نقاط قوة تكاملية، لا يلبي أي من النموذجين حاليًا المعايير السريرية اللازمة للتشخيص الموثوق، مما يشير إلى الحاجة لمزيد من التحسين والتحقق.
DOI: https://doi.org/10.1007/s00784-025-06156-0
PMID: https://pubmed.ncbi.nlm.nih.gov/39888441
Publication Date: 2025-01-31
Author(s): Fatmanur Ketenci et al.
Primary Topic: Dental Radiography and Imaging
Overview
This study aimed to evaluate the performance of the DeepLabv3+ model compared to the U-Net model for detecting and segmenting apical lesions in panoramic radiography. A dataset of 260 annotated panoramic images was utilized, with both models applied under the same hyper-parameters. The results indicated that DeepLabv3+ significantly outperformed U-Net in terms of Area Under the Curve (AUC) and recall, achieving improvements of 29.96% and 61.06%, respectively. Conversely, U-Net demonstrated superior precision and F1-score, with enhancements of 69.17% and 25.55%. The Intersection over Union (IoU) results showed no statistically significant difference between the two models.
Despite the promising performance of DeepLabv3+, the study highlights limitations due to the small dataset size, which may hinder clinical applicability. The authors suggest that with a larger dataset and refined training processes, both models could enhance clinical diagnosis and treatment planning. Comparisons with previous studies reveal that model performance can vary significantly based on factors such as dataset size, hyper-parameter settings, and evaluation strategies. Overall, while DeepLabv3+ shows potential for apical lesion segmentation, further improvements are necessary for clinical implementation.
Introduction
The introduction discusses apical periodontitis, an inflammatory condition affecting the root apex of teeth, primarily due to bacterial infections in the pulp, which can lead to significant complications if misdiagnosed. Radiographically, apical periodontitis is identified by periapical radiolucencies, often challenging to detect due to anatomical complexities and the potential for visual fatigue among dentists reviewing numerous images. This can result in incomplete evaluations and misdiagnoses, leading to severe outcomes such as abscesses or tooth loss. To address these challenges, the introduction highlights the potential of AI-based computer-aided diagnosis tools, particularly in the segmentation of apical lesions, which can enhance diagnostic accuracy and treatment planning.
The text further elaborates on various AI models employed in medical imaging, including U-Net and DeepLabv3+, noting that while U-Net has been the primary focus for apical lesion segmentation, DeepLabv3+ has not been previously applied in this context. The study aims to compare the effectiveness of these two models in accurately segmenting apical lesions, positing that improved segmentation could lead to timely diagnoses and better patient outcomes, ultimately reducing treatment costs and enhancing clinical efficiency.
Methods
This study adhered to the STROBE guidelines and received ethical approval from the Non-Interventional Clinical Research Ethics Committee of Yeditepe University. Conducted in accordance with the Declaration of Helsinki, the research involved the analysis of panoramic radiographs randomly selected from the Faculty of Dentistry archives. The Morita Veraviewepocs system was utilized to capture these images, with specific parameters set for exposure. Radiographs featuring mixed dentition or technical issues were excluded, resulting in a final dataset of 260 anonymized images, which were annotated by two experienced dental radiologists and a master reviewer using the Computer Vision Annotation Tool (CVAT).
The dataset was divided into training and testing subsets using a 5-fold cross-validation method, with 208 images allocated for training and 52 for testing. The study employed the DeepLabv3+ model for segmenting apical lesions, utilizing an encoder-decoder architecture with atrous convolution and transfer learning from ResNet50 for feature extraction. In comparison, a U-Net model was also evaluated under similar conditions. Performance metrics, including precision, recall, F1-score, and Intersection over Union (IoU), were calculated to assess model efficacy. Results indicated that the DeepLabv3+ model outperformed U-Net in terms of Area Under the Curve (AUC) and recall, while U-Net demonstrated superior IoU, precision, and F1-score. The findings underscore the comparative effectiveness of these deep learning models in medical image segmentation tasks.
Results
The results section presents an evaluation of the DeepLabv3+ model’s performance in segmenting apical lesions, utilizing specified performance metrics. The findings indicate that DeepLabv3+ was compared against the U-Net model, a widely recognized benchmark in apical lesion segmentation. To ensure a fair assessment, both models were configured with identical hyper-parameters, as detailed in Table 1. This methodological consistency allows for a reliable comparison of the segmentation capabilities of the two models.
Discussion
In this study, the performance of the DeepLabv3+ model was compared to the U-Net model for the segmentation of apical lesions. The results indicated that DeepLabv3+ achieved statistically significant improvements over U-Net in terms of Area Under the Curve (AUC) and recall, with p-values of 0.00065 and 0.00125, respectively. Conversely, U-Net demonstrated superior precision and F1-score, although the differences in Intersection over Union (IoU) and recall metrics were not statistically significant. The findings suggest that DeepLabv3+ is preferable for capturing potential lesions, enhancing early diagnosis, while U-Net is favored for minimizing false positives.
The study also highlighted the limitations of both models, including the small dataset of 260 images and the challenges associated with accurate annotation. The authors noted that previous studies utilizing cropping techniques and larger datasets reported better performance metrics, emphasizing the importance of these factors in model training. Future research should focus on larger, more diverse datasets and explore alternative deep learning architectures to improve segmentation accuracy. Overall, while DeepLabv3+ and U-Net exhibit complementary strengths, neither model currently meets the clinical standards necessary for reliable diagnosis, indicating a need for further refinement and validation.
