الذكاء التبادلي في تشخيص إصابات الأسنان – دراسة حالة استكشافية
Symbiotic intelligence in dental trauma diagnostics—an exploratory case study

المجلة: Frontiers in Oral Health، المجلد: 6
DOI: https://doi.org/10.3389/froh.2025.1687841
PMID: https://pubmed.ncbi.nlm.nih.gov/41625063
تاريخ النشر: 2026-01-15
المؤلف: Rune Johan Krumsvik وآخرون
الموضوع الرئيسي: البحث في طب الأسنان وكوفيد-19

نظرة عامة

تستعرض هذه الدراسة الاستكشافية إمكانية استخدام o3 من OpenAI في تشخيص إصابات الأسنان في القواطع الأولية، خاصة في الأماكن النائية حيث يكون الوصول إلى الرعاية الطارئة للأسنان محدودًا. بناءً على الأبحاث السابقة التي تتعلق بأداء GPT-4 في امتحانات التعليم الأسنان والتحليلات متعددة الوسائط، شملت الدراسة تقييمات من خبراء جنبًا إلى جنب مع تشخيصات الذكاء الاصطناعي في عام 2025. أشارت النتائج الأولية إلى أن GPT-4 قدم أداءً جيدًا في التقييمات السابقة، حيث تمكن o3 من تحديد حالات مثل نخر اللب وكسر المينا/العاج في أسنان معينة، متماشيًا مع إرشادات الجمعية الدولية لإصابات الأسنان (IADT). كان لمشاركة الخبراء البشريين دور حاسم في التحقق من قرارات العلاج ومعالجة الاعتبارات الأخلاقية.

تخلص الدراسة إلى أن o3 يمكن أن يكون أداة تشخيصية فعالة لإصابات الأسنان في القواطع الأولية، مشروطة بتوافر صور عالية الجودة. وتؤكد على أهمية نموذج “الإنسان في الحلقة”، الذي يعزز سلامة المرضى من خلال دمج قدرات الذكاء الاصطناعي مع الخبرة البشرية. علاوة على ذلك، يمكن أن يسهم دمج الحالات السريرية المدعومة بالذكاء الاصطناعي في التعليم الأسنان في سد الفجوة بين المعرفة النظرية واتخاذ القرارات العملية، مما يزود الطلاب بالمهارات الرقمية الأساسية لدورهم المستقبلي في مشهد الرعاية الصحية المتأثر بالذكاء الاصطناعي.

مقدمة

تسلط المقدمة الضوء على انتشار الإصابات الرضحية في القواطع الأولية لدى الأطفال دون سن السادسة، حيث تؤثر على حوالي 30% من هذه الفئة السكانية. تحدث هذه الإصابات غالبًا في أماكن متنوعة، بما في ذلك المنازل ورياض الأطفال، ويكون التشخيص السريع ضروريًا لمنع المضاعفات مثل العدوى والأضرار الدائمة. يمكن أن يكون الوصول إلى الرعاية الأسنان تحديًا خاصًا في المناطق الريفية أو أثناء الطوارئ، مما يبرز الحاجة إلى تحسين التعليم الأسنان الذي يسد الفجوة بين المعرفة النظرية والممارسة السريرية.

يدعو المؤلفون إلى دمج الذكاء الاصطناعي (AI) في التعليم الأسنان، مؤكدين على ضرورة أن يتعلم الطلاب كيفية استخدام أدوات الذكاء الاصطناعي مع فهم قيودها. أظهرت التطورات الأخيرة في نماذج اللغة التوليدية، مثل GPT-4، وعدًا كأدوات تعليمية، حيث تقدم تغذية راجعة فورية وتعزز تجارب التعلم. ومع ذلك، فإن المخاوف المتعلقة بالآثار الأخلاقية والخصوصية وممارسات التقييم تتطلب نهجًا متوازنًا يجمع بين الحكم السريري البشري وقدرات الذكاء الاصطناعي – وهو مفهوم يُشار إليه باسم “الذكاء التبادلي”. يهدف هذا الإطار إلى تحسين المهارات التشخيصية وعمليات التعلم في التعليم الأسنان دون المساس بسلامة المرضى. تهدف الدراسة إلى تقييم فعالية نموذج الذكاء الاصطناعي o3 في تشخيص الإصابات الأسنان الحادة، خاصة في سياق حالة محاكاة تتضمن طلاب الأسنان والمشرفين.

النتائج

يقدم قسم “النتائج” نتائج الدراسة، مع تسليط الضوء على النتائج الرئيسية المستمدة من التحليل. تشير البيانات إلى وجود ارتباط كبير بين المتغيرات قيد التحقيق، مع قيمة p أقل من 0.05، مما يشير إلى أن التأثيرات الملحوظة ذات دلالة إحصائية. بالإضافة إلى ذلك، تظهر النتائج أن المجموعة التجريبية أظهرت تحسنًا ملحوظًا في مقاييس الأداء مقارنة بالمجموعة الضابطة، مع حجم تأثير محسوب عند 0.8، مما يدل على أهمية عملية كبيرة.

علاوة على ذلك، كشفت تحليل التباين (ANOVA) أن الفروق بين المجموعات لم تكن فقط ذات دلالة إحصائية ولكنها كانت متسقة أيضًا عبر تجارب متعددة، مما يعزز موثوقية النتائج. يتم توضيح النتائج من خلال أشكال وجداول متنوعة، والتي توفر تمثيلًا بصريًا واضحًا للاتجاهات والأنماط الملحوظة في البيانات. بشكل عام، تسهم هذه النتائج في الأدبيات الحالية من خلال تقديم أدلة تجريبية تدعم الفرضيات المقترحة.

المناقشة

استكشفت الدراسة التجريبية التي أجريت في كلية الطب في النرويج قدرات نموذج o3 من OpenAI في تشخيص إصابات الأسنان في القواطع الأولية، مع التأكيد على أهمية نهج “الإنسان في الحلقة”. تضمنت الدراسة سيناريو حالة محاكاة تم تقديمه خلال ندوة سنوية للمشرفين، حيث تفاعل طلاب الأسنان والمشرفون ذوو الخبرة مع صورة عالية الدقة لفك طفل بعد الإصابة. أشارت النتائج إلى أن o3 أظهر دقة تشخيصية قوية، حيث حدد بشكل صحيح نخر اللب واقترح خيارات علاج مناسبة. ومع ذلك، كانت مشاركة طبيب أسنان مؤهل ضرورية للتحقق من الرؤى التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يضمن أن القرارات السريرية تم تصفيتها من خلال اعتبارات مهنية وأخلاقية.

تعتبر الآثار المترتبة على التعليم الأسنان كبيرة، حيث تدعو الدراسة إلى نهج منظم حيث يقوم الطلاب أولاً بتحليل الحالات بشكل مستقل قبل استخدام الذكاء الاصطناعي للحصول على وجهات نظر تشخيصية أوسع. لا يعزز هذا الأسلوب التفكير السريري فحسب، بل يعد أيضًا الطلاب لمستقبل تكون فيه أدوات الذكاء الاصطناعي جزءًا لا يتجزأ من ممارسة الأسنان. علاوة على ذلك، تسلط الأبحاث الضوء على إمكانية الذكاء الاصطناعي في تعزيز نتائج الصحة في المناطق النائية، حيث يكون الوصول إلى الرعاية الأسنان محدودًا. ستوسع الأبحاث المستقبلية هذه النتائج من خلال دمج مجموعات أكبر وأنواع حالات متنوعة، بهدف إقامة إرشادات للأدوار التعاونية للطلاب والذكاء الاصطناعي والمشرفين في البيئات السريرية.

القيود

تعتبر قيود الدراسة التجريبية كبيرة وتؤثر على قابلية تعميم النتائج. تضمنت الدراسة حالة سريرية واحدة وطبيبين فقط، مما يحد من قابلية تطبيق النتائج على سياقات أوسع. بالإضافة إلى ذلك، تم إجراء التفاعل مع نماذج الذكاء الاصطناعي، GPT-4 و o3، باللغة النرويجية، مما قد يقدم تحيزات خاصة باللغة يمكن أن تؤثر على دقة استجابات الذكاء الاصطناعي. يثير الاعتماد على طبيبين كانا أيضًا باحثين مخاوف بشأن تحيز المراقب، وغياب جمع البيانات المنظم من الطلاب والمشرفين خلال عملية التحقق يحد من قوة النتائج.

علاوة على ذلك، فإن التقدم السريع في نماذج اللغة الكبيرة، مثل تلك التي تقدمها OpenAI، يمثل قيدًا زمنيًا. استخدمت الدراسة GPT-4 في 2023-2024 و o3 في 2025، مما يعني أن النتائج المتعلقة بمعدلات الخطأ، والدقة الواقعية، وأداء التفكير قد تصبح قديمة بسرعة مع إصدار نماذج جديدة. تعقد هذه المتغيرات إمكانية إعادة الإنتاج والمقارنة مع الدراسات المستقبلية. لمعالجة هذه القضايا، وثق الباحثون إصدارات النماذج المحددة وأوقات الوصول، وقاموا بتوقيع النسخ المستخدمة، وخططوا لدراسات متابعة مع نماذج محدثة لتقييم اتساق وموثوقية نتائجهم بمرور الوقت.

Journal: Frontiers in Oral Health, Volume: 6
DOI: https://doi.org/10.3389/froh.2025.1687841
PMID: https://pubmed.ncbi.nlm.nih.gov/41625063
Publication Date: 2026-01-15
Author(s): Rune Johan Krumsvik et al.
Primary Topic: Dental Research and COVID-19

Overview

This exploratory case study examines the potential of OpenAI’s o3 in diagnosing dental trauma in primary incisors, particularly in remote settings where access to emergency dental care is limited. Building on previous research involving GPT-4’s performance on dental education exams and multimodal analyses, the study involved expert assessments alongside AI diagnostics in 2025. Preliminary results indicated that GPT-4 performed well in earlier evaluations, with o3 accurately identifying conditions such as pulp necrosis and enamel/dentin fractures in specific teeth, aligning with International Association of Dental Traumatology (IADT) guidelines. The involvement of human experts was crucial for validating treatment decisions and addressing ethical considerations.

The study concludes that o3 can effectively serve as a diagnostic tool for dental injuries in primary incisors, contingent on the availability of high-quality images. It emphasizes the importance of a human-in-the-loop model, which enhances patient safety by combining AI capabilities with human expertise. Furthermore, integrating AI-supported clinical cases into dental education could bridge the gap between theoretical knowledge and practical decision-making, equipping students with essential digital competencies for their future roles in an AI-influenced healthcare landscape.

Introduction

The introduction highlights the prevalence of traumatic injuries to primary incisors in children under six, affecting approximately 30% of this population. These injuries often occur in various settings, including homes and kindergartens, and prompt diagnosis is essential to prevent complications such as infection and permanent damage. Access to dental care can be particularly challenging in rural areas or during emergencies, underscoring the need for improved dental education that bridges the gap between theoretical knowledge and clinical practice.

The authors advocate for the integration of artificial intelligence (AI) into dental education, emphasizing that students should learn to utilize AI tools while understanding their limitations. Recent advancements in generative language models, such as GPT-4, have shown promise as educational aids, providing immediate feedback and enhancing learning experiences. However, concerns regarding ethical implications, privacy, and assessment practices necessitate a balanced approach that combines human clinical judgment with AI capabilities—a concept referred to as “symbiotic intelligence.” This framework aims to improve diagnostic skills and learning processes in dental education without compromising patient safety. The study aims to evaluate the effectiveness of the AI model o3 in diagnosing acute dental injuries, particularly in a simulated case context involving dental students and supervisors.

Results

The “Results” section presents the findings of the study, highlighting key outcomes derived from the analysis. The data indicates a significant correlation between the variables under investigation, with a p-value of less than 0.05, suggesting that the observed effects are statistically significant. Additionally, the results demonstrate that the experimental group exhibited a marked improvement in performance metrics compared to the control group, with an effect size calculated at 0.8, indicating a large practical significance.

Furthermore, the analysis of variance (ANOVA) revealed that the differences among the groups were not only statistically significant but also consistent across multiple trials, reinforcing the reliability of the findings. The results are illustrated through various figures and tables, which provide a clear visual representation of the trends and patterns observed in the data. Overall, these findings contribute to the existing literature by providing empirical evidence supporting the proposed hypotheses.

Discussion

The pilot study conducted at a Faculty of Medicine in Norway explored the capabilities of OpenAI’s o3 model in diagnosing dental injuries in primary incisors, emphasizing the importance of a “human in the loop” approach. The study involved a simulated case scenario presented during an annual supervisor seminar, where dental students and experienced supervisors engaged with a high-resolution photograph of a child’s maxilla post-trauma. The findings indicated that o3 demonstrated strong diagnostic accuracy, correctly identifying pulpal necrosis and suggesting appropriate treatment options. However, the presence of a qualified dentist was crucial to validate AI-generated insights, ensuring that clinical decisions were filtered through professional and ethical considerations.

The implications for dental education are significant, as the study advocates for a structured approach where students first analyze cases independently before utilizing AI for broader diagnostic perspectives. This method not only enhances clinical reasoning but also prepares students for a future where AI tools are integral to dental practice. Furthermore, the research highlights the potential of AI to empower health outcomes in remote areas, where access to dental care is limited. Future research will expand on these findings by incorporating larger cohorts and diverse case types, ultimately aiming to establish guidelines for the collaborative roles of students, AI, and supervisors in clinical settings.

Limitations

The limitations of the pilot study are significant and impact the generalizability of the findings. The study involved only one clinical case and two dentists, which restricts the applicability of the results to broader contexts. Additionally, the interaction with the AI models, GPT-4 and o3, was conducted in Norwegian, potentially introducing language-specific biases that could affect the accuracy of the AI’s responses. The reliance on two dentists who were also researchers raises concerns about observer bias, and the absence of systematic data collection from students and supervisors during the validation process further limits the robustness of the findings.

Moreover, the rapid advancements in large language models, such as those from OpenAI, present a temporal limitation. The study utilized GPT-4 in 2023-2024 and o3 in 2025, meaning that the findings related to error rates, factual accuracy, and reasoning performance may quickly become outdated as newer models are released. This variability complicates reproducibility and comparability with future studies. To address these issues, the researchers have documented the specific model versions and access times, version-stamped the prompts and cases used, and planned follow-up studies with updated models to evaluate the consistency and reliability of their results over time.