تقدير عمر الإنسان باستخدام التعلم الآلي على الأشعة السينية البانورامية للمرضى البرازيليين
Estimation of human age using machine learning on panoramic radiographs for Brazilian patients

المجلة: Scientific Reports، المجلد: 14، العدد: 1
DOI: https://doi.org/10.1038/s41598-024-70621-1
PMID: https://pubmed.ncbi.nlm.nih.gov/39181957
تاريخ النشر: 2024-08-24
المؤلف: Willian Vieira de Oliveira وآخرون
الموضوع الرئيسي: دراسات الأنثروبولوجيا الجنائية والبيوآركيولوجيا

نظرة عامة

تستكشف هذه الورقة البحثية دمج التقنيات الإشعاعية ومنهجيات التعلم الآلي المتقدمة لتعزيز تقدير العمر في العلوم الجنائية. باستخدام مجموعة بيانات جديدة تتكون من 12,827 صورة أشعة بانورامية للأسنان من السكان البرازيليين، تستخدم الدراسة نموذج InceptionV4 المعدل مع تقنيات زيادة البيانات، محققة خطأ مطلق متوسط للاختبار قدره 3.1 سنوات وقيمة R-squared تبلغ 95.5%. يحدد النموذج بفعالية الميزات الحرجة لتقييم العمر، مثل أبعاد غرفة اللب ومراحل تكلس الأسنان الدائمة، بينما يدمج أيضًا المعلومات التشريحية من الفك السفلي والجيوب الأنفية العلوية، مما يظهر فعاليته حتى في الحالات الخالية من الأسنان.

تشير النتائج إلى أن نموذج التعلم العميق، عند دمجه مع زيادة البيانات الاستراتيجية، يحسن بشكل كبير من قدرات التعميم واستقرار النموذج عبر مختلف الفئات العمرية. ومع ذلك، لا تزال التحديات قائمة في التنبؤ بدقة بالعمر عند الأطراف القصوى من الطيف (0-5 سنوات و70+ سنة)، مما يشير إلى الحاجة لاستراتيجيات زيادة مستهدفة. تم الاعتراف بحدود مجموعة البيانات، بما في ذلك الحصر الجغرافي والاختلالات الكامنة، إلى جانب تأثير العوامل الخارجية على نتائج صحة الأسنان. تهدف الأبحاث المستقبلية إلى توسيع مجموعة البيانات وإجراء دراسات طولية لتقييم قوة النموذج التنبؤية مع مرور الوقت، مما يعزز في النهاية دقته وموثوقيته في السيناريوهات السريرية الواقعية. تسلط هذه الدراسة الضوء على إمكانيات تطبيقات الذكاء الاصطناعي في طب الأسنان والأشعة، مما يمهد الطريق لمزيد من التقدم في منهجيات تقدير العمر.

الطرق

حصلت الدراسة على موافقة أخلاقية من الجامعة الفيدرالية في بيرنامبوكو ومركز العلوم الطبية (CAAE 42878921.6.0000.5208). استخدمت صور الأشعة البانورامية المستمدة من قاعدة بيانات الجامعة ومن ولاية بيرنامبوكو، مما يبرز أهمية مجموعة بيانات برازيلية بسبب الخلفية الجينية المتنوعة في البلاد الناتجة عن الهجرة التاريخية. تم تجميع مجموعة بيانات شاملة تتكون من 12,827 صورة، تضم مرضى تتراوح أعمارهم بين 2.25 و 96.50 سنة.

على عكس الأبحاث السابقة، اختارت هذه الدراسة عدم استبعاد أو معالجة العينات، بهدف عكس الظروف الواقعية بدقة أكبر وتعزيز التطبيق العملي للنماذج المطورة لتحليل العمر. قبل الدراسة، قام طبيبان أسنان ذوا خبرة متخصصان في الأشعة وطب الأسنان الجنائي بتقييم الصور لضمان توافقها مع المعايير السريرية، مما يضمن جودة وموثوقية البيانات المستخدمة في التحليل.

النتائج

في هذا القسم، يقدم المؤلفون نتائج نموذج تقدير العمر الخاص بهم بناءً على شبكة InceptionV4 المعدلة. حقق النموذج الأساسي، المدرب على 80% من الموضوعات والمصادق عليه على 10%، خطأ مطلق متوسط (MAE) قدره $3.83 \pm 0.224$ سنوات وخطأ متوسط تربيعي (MSE) قدره $27.83 \pm 0.326$. أظهر مجموعة احتياطية من 1004 امتحانات MAE قدره $3.88 \pm 0.231$ وMSE قدره $26.47 \pm 0.333$. قدمت مقاييس إضافية، مثل خطأ مطلق وسطي قدره 2.78 سنة ونطاق ربعي (IQR) قدره 4.69 سنة، رؤى حول تباين التنبؤ. أوضح النموذج 93% من التباين في العمر، كما هو موضح بقيمة R-squared تبلغ 0.93. أظهر تحليل بلاند-ألتمن عدم وجود انحياز منهجي، على الرغم من وجود أخطاء عشوائية، خاصة مع زيادة العمر، مما يشير إلى أن دقة النموذج قد تنخفض بالنسبة للأفراد الأكبر سناً.

لمعالجة اختلال مجموعة البيانات وتحسين الأداء، نفذ المؤلفون زيادة البيانات، مما زاد من حجم مجموعة البيانات ثلاث مرات. حقق النموذج المعزز MAE مصدق عليه قدره $3.13 \pm 0.19$ سنوات وMSE قدره $19 \pm 0.27$، مع خطأ مطلق وسطي قدره 2.16 سنة وIQR قدره 3.55 سنة، مما يشير إلى دقة محسنة في التنبؤ. بينما أظهر النموذج المعزز انحيازًا منهجيًا طفيفًا وتقديرًا أقل قليلاً للعمر، إلا أنه قلل بشكل كبير من تباين التنبؤ. تم تقييم الأداء أيضًا حسب الجنس البيولوجي ومجموعة العمر، مما كشف عن دقة قابلة للمقارنة عبر الجنسين وأبرز الأداء المحسن للأفراد الذين تتراوح أعمارهم بين 24 وما دون (MAE قدره 1.18 سنة) مقارنة بأولئك الذين تزيد أعمارهم عن 24 (MAE قدره 3.78 سنة)، مما يبرز تعقيدات تقدير العمر في الفئات العمرية الأكبر بسبب عوامل بيولوجية وبيئية متنوعة.

المناقشة

تسلط قسم المناقشة في الورقة البحثية الضوء على فعالية نموذج تقدير العمر المقترح، الذي يستخدم بنية InceptionV4 جنبًا إلى جنب مع تقنيات زيادة البيانات المختلفة. يظهر النموذج أداءً قويًا عبر مقاييس تقييم متعددة، مما يشير إلى استقراره ومرونته تجاه القيم الشاذة. على الرغم من النجاح العام، لا تزال التحديات قائمة، خاصة مع مجموعة العمر 0-5، حيث تميل التنبؤات إلى أن تكون مبالغ فيها بسبب تأثير البيانات المعززة من مجموعة العمر 5-10. يقترح المؤلفون أن توسيع مجموعة بيانات التدريب بمزيد من بيانات الامتحانات الخام من الفئات العمرية غير الممثلة يمكن أن يعزز دقة النموذج.

تظهر التقييمات الخبيرة لتنبؤات النموذج، المدعومة بخريطة حرارة التدرجات المتكاملة، أن النموذج يركز بشكل مناسب على الميزات السريرية ذات الصلة، مثل قياسات اللب ومراحل تكلس الأسنان، بما يتماشى مع طرق طب الأسنان الجنائي المعتمدة. تعزز قدرة النموذج على تحديد هذه الميزات من صلاحيتها السريرية، حيث تتماشى مع التغيرات الفسيولوجية المرتبطة بالشيخوخة. علاوة على ذلك، يظهر النموذج أداءً متسقًا عبر الجنسين البيولوجيين ويظهر دقة أعلى للأفراد الأصغر سنًا، بينما تقدم الفئات العمرية الأكبر مزيدًا من التعقيد بسبب التغيرات المستمرة في الأسنان. تؤكد النتائج على الحاجة إلى مزيد من التحسين في تقدير العمر للأفراد الأكبر سناً، ربما من خلال دمج ميزات أكثر تعقيدًا أو بيانات إضافية. بشكل عام، تؤسس الأبحاث أساسًا واعدًا لمزيد من التقدم في تقدير العمر باستخدام الأشعة البانورامية، خاصة في سياق السكان البرازيليين.

Journal: Scientific Reports, Volume: 14, Issue: 1
DOI: https://doi.org/10.1038/s41598-024-70621-1
PMID: https://pubmed.ncbi.nlm.nih.gov/39181957
Publication Date: 2024-08-24
Author(s): Willian Vieira de Oliveira et al.
Primary Topic: Forensic Anthropology and Bioarchaeology Studies

Overview

This research paper explores the integration of radiological techniques and advanced machine learning methodologies to enhance age estimation in Forensic Sciences. Utilizing a novel dataset of 12,827 dental panoramic X-ray images from the Brazilian population, the study employs an adapted InceptionV4 model with data augmentation techniques, achieving a Test Mean Absolute Error of 3.1 years and an R-squared value of 95.5%. The model effectively identifies critical features for age assessment, such as pulp chamber dimensions and stages of permanent teeth calcification, while also incorporating anatomical information from the mandible and maxillary sinus, demonstrating efficacy even in edentulous cases.

The findings indicate that the deep learning model, when combined with strategic data augmentation, significantly improves generalization capabilities and model stability across various age ranges. However, challenges persist in accurately predicting ages at the extremes of the spectrum (0-5 years and 70+ years), suggesting the need for targeted augmentation strategies. Limitations of the dataset, including geographic confinement and inherent imbalances, are acknowledged, alongside the impact of external factors on dental health outcomes. Future research aims to expand the dataset and conduct longitudinal studies to assess the model’s predictive power over time, ultimately enhancing its accuracy and reliability in real-world clinical scenarios. This work highlights the potential of AI applications in dentistry and radiology, paving the way for further advancements in age estimation methodologies.

Methods

The study received ethical approval from the Federal University of Pernambuco and the Center for Medical Sciences (CAAE 42878921.6.0000.5208). It utilized panoramic x-ray images sourced from the university database and the state of Pernambuco, emphasizing the importance of a Brazilian dataset due to the country’s diverse genetic background resulting from historical immigration. A comprehensive dataset comprising 12,827 images was compiled, featuring patients aged between 2.25 and 96.50 years.

In contrast to previous research, this study opted not to exclude or preprocess samples, aiming to reflect real-world conditions more accurately and enhance the practical applicability of the models developed for age analysis. Prior to the study, two experienced dentists specializing in radiology and forensic dentistry assessed the images to ensure they met clinical standards, thus ensuring the quality and reliability of the data used in the analysis.

Results

In this section, the authors present the results of their age estimation model based on an adapted InceptionV4 Network. The baseline model, trained on 80% of the subjects and validated on 10%, achieved a Mean Absolute Error (MAE) of $3.83 \pm 0.224$ years and a Mean Squared Error (MSE) of $27.83 \pm 0.326$. A holdout set of 1004 exams revealed an MAE of $3.88 \pm 0.231$ and an MSE of $26.47 \pm 0.333$. Additional metrics, such as a median absolute error of 2.78 years and an Interquartile Range (IQR) of 4.69 years, provided insights into prediction variability. The model explained 93% of the variance in age, as indicated by an R-squared value of 0.93. Bland-Altman analysis showed no systematic bias, although random errors were present, particularly with increasing age, suggesting that model accuracy may decline for older individuals.

To address dataset imbalance and improve performance, the authors implemented data augmentation, tripling the dataset size. The augmented model achieved a validation MAE of $3.13 \pm 0.19$ years and an MSE of $19 \pm 0.27$, with a median absolute error of 2.16 years and an IQR of 3.55 years, indicating enhanced prediction precision. While the augmented model showed minor systematic bias and a slight underestimation of age, it significantly reduced prediction variability. Performance was also evaluated by biological sex and age group, revealing comparable accuracy across genders and highlighting improved performance for individuals aged 24 and under (MAE of 1.18 years) compared to those over 24 (MAE of 3.78 years), underscoring the complexities of age estimation in older populations due to various biological and environmental factors.

Discussion

The discussion section of the research paper highlights the effectiveness of the proposed age estimation model, which utilizes the InceptionV4 architecture alongside various data augmentation techniques. The model demonstrates robust performance across multiple assessment metrics, indicating its stability and resilience to outliers. Despite the overall success, challenges remain, particularly with the 0-5 age group, where predictions tend to be overestimated due to the influence of augmented data from the 5-10 age group. The authors suggest that expanding the training dataset with additional raw exam data from underrepresented age brackets could enhance model accuracy.

Expert evaluations of the model’s predictions, supported by integrated gradients heatmaps, reveal that the model appropriately focuses on clinically relevant features, such as pulp measurements and tooth calcification stages, consistent with established forensic dentistry methods. The model’s ability to identify these features reinforces its clinical validity, as it aligns with physiological changes associated with aging. Furthermore, the model exhibits consistent performance across different biological sexes and demonstrates higher accuracy for younger individuals, while older age groups present more complexity due to continuous dental changes. The findings underscore the need for further refinement in age estimation for older individuals, potentially through the integration of more sophisticated features or additional data. Overall, the research establishes a promising foundation for future advancements in age estimation using panoramic radiographs, particularly within the context of the Brazilian population.