DOI: https://doi.org/10.1007/s00784-024-05762-8
PMID: https://pubmed.ncbi.nlm.nih.gov/38849649
تاريخ النشر: 2024-06-08
المؤلف: Shankeeth Vinayahalingam وآخرون
الموضوع الرئيسي: أمراض الفم وعلاجها
نظرة عامة
تدرس هذه الدراسة الكشف التلقائي وتصنيف الاضطرابات الفموية المحتملة الخبيثة (OPMD)، وتحديداً اللويحات البيضاء والتهاب اللكنة الفموية (OLP)، إلى جانب سرطان الخلايا الحرشفية الفموية (OSCC) والغشاء المخاطي الفموي الصحي، باستخدام محولات الرؤية على الصور السريرية. تم استخدام مجموعة بيانات تضم 4,161 صورة مشروحة، مع تخصيص 3,337 صورة للتدريب والتحقق، و824 للاختبار. النموذج المستخدم، وهو Mask R-CNN المدمج مع Swin Transformer، خضع للتحقق المتقاطع بخمس طيات، وتم تقييم أدائه باستخدام مقاييس مثل الدقة، ودرجة F1، والحساسية، والنوعية، والدقة، والمساحة تحت منحنى خصائص التشغيل المستقبلية (AUC).
أشارت النتائج إلى أن النموذج حقق درجة F1 قدرها 0.852 وAUC قدره 0.974 لاكتشاف OSCC، مما يدل على فعالية عالية. بالنسبة لـ OLP، كانت درجة F1 0.825 مع AUC قدره 0.948، بينما حقق اكتشاف اللويحات البيضاء درجة F1 قدرها 0.796 وAUC قدره 0.938، مما يدل على فعالية معتدلة. تشير النتائج إلى أن النهج المقترح في التعلم العميق يمكن أن يعزز الكشف المبكر عن OPMD، مما قد يقلل من عبء سرطان الفم من خلال تسهيل التشخيص المبكر وبدء العلاج.
مقدمة
تؤكد مقدمة ورقة البحث على الأهمية الحاسمة لتشخيص الاضطرابات الفموية المحتملة الخبيثة (OPMD) خلال الفحوصات السنية، حيث إنه أمر حيوي للعلاج الفعال، وتثقيف المرضى بشأن المخاطر، والوقاية من سرطان الفم. تشمل OPMD مجموعة متنوعة من الآفات المخاطية التي لديها خطر مرتفع للتطور إلى سرطان الخلايا الحرشفية الفموية (OSCC)، مع حالات شائعة تشمل اللويحات البيضاء، واللويحات الحمراء، والتهاب اللكنة الفموية (OLP). تختلف معدلات تحول هذه الاضطرابات إلى أورام خبيثة بشكل كبير، حيث يبلغ متوسط معدل تحول OLP 1.4%، بينما يمكن أن تصل اللويحات البيضاء المتكاثرة إلى 74%. تتراوح طرق التشخيص الحالية من الفحص البصري إلى الخزعات الغازية، لكن دقتها تظل محدودة، خاصة بالنسبة للتقنيات غير الغازية مثل الفلورية الذاتية والتلوين الحيوي.
تقترح الدراسة استكشاف فعالية نماذج التعلم العميق، وتحديداً بنية Mask R-CNN مع هيكل Swin Transformer، في الكشف عن OPMD، بما في ذلك اللويحات البيضاء وOLP، بالإضافة إلى OSCC من خلال الصور الفوتوغرافية لتجويف الفم. من خلال الاستفادة من تقنيات التعلم الآلي المتقدمة، تهدف البحث إلى تعزيز القدرات التشخيصية غير الغازية لـ OPMD وتحسين الكشف المبكر عن سرطان الفم، مع معالجة التحديات التي تطرحها طرق التشخيص الحالية.
طرق
توضح قسم “المواد والطرق” تصميم التجربة والإجراءات المستخدمة في الدراسة. يتناول المواد المحددة المستخدمة، بما في ذلك أي مواد كيميائية، ومعدات، وعينات بيولوجية، لضمان إمكانية تكرار التجارب. تشمل المنهجية البروتوكولات المتبعة لجمع البيانات، بما في ذلك أي تحليلات إحصائية تم إجراؤها لتفسير النتائج.
بالإضافة إلى ذلك، قد يصف القسم الظروف التجريبية، مثل درجة الحرارة، والمدة، وأي ضوابط تم تنفيذها للتحقق من النتائج. بشكل عام، يخدم هذا القسم لتقديم نظرة شاملة على التقنيات والمواد المستخدمة، مما يمكّن الباحثين الآخرين من تكرار الدراسة والتحقق من استنتاجاتها.
نتائج
تشير النتائج إلى أن نموذج Mask R-CNN الذي يستخدم هيكل Swin Transformer أظهر أداءً قويًا في الكشف عن سرطان الخلايا الحرشفية الفموية (OSCC)، محققًا درجة F1 قدرها 0.852 ومساحة تحت المنحنى (AUC) قدرها 0.974. كانت فعالية النموذج في تحديد التهاب اللكنة الفموية (OLP) واللويحات البيضاء معتدلة، مع درجات F1 قدرها 0.825 (AUC = 0.948) لـ OLP و0.796 (AUC = 0.938) للويحات البيضاء، كما هو موضح في الجدول 1 ومبين في الشكل 2.
على الرغم من هذه النتائج الواعدة، واجه النموذج صعوبة في تكرار التقسيمات المرجعية بشكل متسق، كما هو موضح في الأشكال 1 و3. ومع ذلك، كانت التنبؤات على مستوى الصورة عمومًا متوافقة مع المرجع، وهو ما تدعمه أيضًا منحنيات ROC المقدمة في الشكل 4.
مناقشة
في هذه الدراسة، تم جمع مجموعة بيانات من 4,161 صورة سريرية بشكل رجعي لتحليل الاضطرابات الفموية المحتملة الخبيثة (OPMD) وسرطان الخلايا الحرشفية الفموية (OSCC). تم وضع علامات على الصور بدقة من قبل أطباء ذوي خبرة باستخدام بروتوكول موحد وبرنامج DARWIN، مما يضمن تقسيمًا دقيقًا على مستوى البكسل للاضطرابات مثل التهاب اللكنة الفموية (OLP)، واللويحات البيضاء، وOSCC. تم استخدام نموذج Mask R-CNN، المعزز بهيكل Swin Transformer، للتقسيم حسب الحالة، مما أظهر دقة عالية في الكشف عن OSCC مع درجة F1 قدرها 0.852 ومساحة تحت منحنى خصائص التشغيل المستقبلية (AUC) قدرها 0.974. ومع ذلك، أظهر النموذج فعالية معتدلة في تحديد OLP واللويحات البيضاء، مع درجات F1 قدرها 0.825 و0.796، على التوالي.
تشير النتائج إلى أنه بينما يمكن للنموذج الكشف بفعالية عن OSCC، فإنه يواجه تحديات مشابهة لتلك التي يواجهها الأطباء، خاصة في التمييز بين اللويحات البيضاء وOSCC في مراحله المبكرة. تم ملاحظة أخطاء في التصنيف، مما يبرز تعقيد هذه الاضطرابات. تدعو الدراسة إلى إجراء أبحاث مستقبلية تشمل مجموعات بيانات متنوعة وتعليقات لتحسين قابلية تعميم النموذج وتطبيقه في البيئات السريرية. بشكل عام، يحمل الكشف التلقائي عن OPMD وOSCC من خلال الصور السريرية وعدًا لتحسين دقة التشخيص وتسهيل التدخلات العلاجية في الوقت المناسب.
DOI: https://doi.org/10.1007/s00784-024-05762-8
PMID: https://pubmed.ncbi.nlm.nih.gov/38849649
Publication Date: 2024-06-08
Author(s): Shankeeth Vinayahalingam et al.
Primary Topic: Oral Health Pathology and Treatment
Overview
This study investigates the automatic detection and classification of oral potentially malignant disorders (OPMD), specifically leukoplakia and oral lichen planus (OLP), alongside oral squamous cell carcinomas (OSCC) and healthy oral mucosa, using vision transformers on clinical photographs. A dataset comprising 4,161 annotated images was utilized, with 3,337 images allocated for training and validation, and 824 for testing. The model employed, a Mask R-CNN integrated with a Swin Transformer, underwent five-fold cross-validation, and its performance was evaluated using metrics such as precision, F1-score, sensitivity, specificity, accuracy, and the area under the receiver operating characteristics curve (AUC).
The results indicated that the model achieved an F1-score of 0.852 and an AUC of 0.974 for OSCC detection, demonstrating high effectiveness. For OLP, the F1-score was 0.825 with an AUC of 0.948, while leukoplakia detection yielded an F1-score of 0.796 and an AUC of 0.938, indicating moderate effectiveness. The findings suggest that the proposed deep learning approach can enhance the early detection of OPMD, potentially reducing the burden of oral cancer by facilitating timely diagnosis and treatment initiation.
Introduction
The introduction of the research paper emphasizes the critical importance of diagnosing oral potentially malignant disorders (OPMD) during dental examinations, as it is vital for effective treatment, patient education regarding risks, and the prevention of oral cancer. OPMD encompasses various mucosal lesions that have an elevated risk of progressing to oral squamous cell carcinoma (OSCC), with common conditions including leukoplakia, erythroplakia, and oral lichen planus (OLP). The transformation rates of these disorders into malignancies vary significantly, with OLP averaging a 1.4% transformation rate, while proliferative verrucous leukoplakia can reach up to 74%. Current diagnostic methods range from visual inspection to invasive biopsies, but their accuracy remains limited, particularly for non-invasive techniques like autofluorescence and vital staining.
The study proposes to explore the efficacy of deep learning models, specifically a Mask R-CNN architecture with a Swin Transformer backbone, in detecting OPMD, including leukoplakia and OLP, as well as OSCC through photographic images of the oral cavity. By leveraging advanced machine learning techniques, the research aims to enhance non-invasive diagnostic capabilities for OPMD and improve early detection of oral cancer, addressing the challenges posed by existing diagnostic methods.
Methods
The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the specific materials used, including any reagents, equipment, and biological samples, ensuring reproducibility of the experiments. The methodology encompasses the protocols followed for data collection, including any statistical analyses performed to interpret the results.
Additionally, the section may describe the experimental conditions, such as temperature, duration, and any controls implemented to validate the findings. Overall, this section serves to provide a comprehensive overview of the techniques and materials utilized, enabling other researchers to replicate the study and verify its conclusions.
Results
The results indicate that the Mask R-CNN model utilizing a Swin Transformer backbone demonstrated strong performance in detecting oral squamous cell carcinoma (OSCC), achieving an F1 score of 0.852 and an area under the curve (AUC) of 0.974. The model’s effectiveness in identifying oral lichen planus (OLP) and leukoplakia was moderate, with F1 scores of 0.825 (AUC = 0.948) for OLP and 0.796 (AUC = 0.938) for leukoplakia, as detailed in Table 1 and illustrated in Figure 2.
Despite these promising results, the model struggled to consistently replicate the reference segmentations, as shown in Figures 1 and 3. However, the image-level predictions were generally in agreement with the reference, which is further supported by the ROC curves presented in Figure 4.
Discussion
In this study, a dataset of 4,161 clinical photographs was retrospectively collected to analyze oral potentially malignant disorders (OPMD) and oral squamous cell carcinoma (OSCC). The images were meticulously annotated by experienced clinicians using a standardized protocol and the DARWIN software, ensuring accurate pixel-wise segmentation of disorders such as oral lichen planus (OLP), leukoplakia, and OSCC. The Mask R-CNN model, enhanced by a Swin Transformer backbone, was employed for instance segmentation, demonstrating high accuracy in detecting OSCC with an F1 score of 0.852 and an area under the receiver operating characteristic curve (AUC) of 0.974. However, the model showed moderate effectiveness in identifying OLP and leukoplakia, with F1 scores of 0.825 and 0.796, respectively.
The findings indicate that while the model can effectively detect OSCC, it faces challenges similar to those encountered by clinicians, particularly in differentiating between leukoplakia and early-stage OSCC. Misclassifications were noted, emphasizing the complexity of these disorders. The study advocates for future research to include diverse datasets and annotations to enhance the model’s generalizability and applicability in clinical settings. Overall, the automatic detection of OPMD and OSCC through clinical photographs holds promise for improving diagnostic accuracy and facilitating timely treatment interventions.
