DOI: https://doi.org/10.1016/j.artmed.2026.103368
PMID: https://pubmed.ncbi.nlm.nih.gov/41610818
تاريخ النشر: 2026-01-28
المؤلف: Gernot Fiala وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في اكتشاف السرطان
نظرة عامة
يقدم هذا القسم إطارًا لتوليد خرائط الفهرس ثنائية الأبعاد، المشار إليها باسم خرائط الأنسجة، لتعزيز البيانات الوصفية المرتبطة بصور الشرائح الكاملة (WSIs). تعتبر صور الشرائح الكاملة صورًا رقمية عالية الدقة ضرورية لمجالات طبية متنوعة، بما في ذلك علم الأمراض وعلم الأورام، ولكن نقص البيانات الوصفية الموحدة يعقد استخدامها في تدريب وتقييم الذكاء الاصطناعي. ينظم الإطار المقترح خرائط الأنسجة في ثلاث طبقات: المادة المصدرية (العضو)، أنواع الأنسجة، والتغيرات المرضية، مما يسمح بتصنيف منظم لشرائح WSI. لا يحسن هذا النهج الطبقي فقط قدرات البحث داخل أرشيفات WSI ولكن يسهل أيضًا تجميع مجموعات بيانات عالية الجودة ومتوازنة لتطبيقات الذكاء الاصطناعي.
تظهر التقييمات التجريبية التوافق بين نموذج البيانات الوصفية من خلال بناء جملة ومعاني موحدة عبر كتالوجات مختلفة. من خلال استخدام مصنفات ثنائية لاستخراج المحتوى تلقائيًا، ينتج الإطار بيانات وصفية جاهزة للذكاء الاصطناعي تقلل من التحيزات في مجموعات بيانات التدريب. تم تقديم أداة مفتوحة المصدر، WSIDOM، لدعم تصور وتحويل التعليقات التوضيحية إلى خرائط الأنسجة، مما يجعلها قابلة للتكيف مع احتياجات البحث المختلفة. تهدف الأعمال المستقبلية إلى تعزيز هذا الإطار من خلال تدريب نموذج تقسيم الأنسجة متعدد الفئات وتنفيذ طرق البحث عن التشابه بناءً على البيانات الوصفية المستخرجة، مما يحسن أداء البحث وقابلية التوسع عبر مجموعات WSI الكبيرة.
مقدمة
تناقش مقدمة الورقة صور الشرائح الكاملة (WSIs)، وهي تمثيلات رقمية عالية الدقة لعينات الأنسجة التي تم الحصول عليها من خلال الخزعة أو الجراحة. يتم استخدام هذه الصور بشكل متزايد في مجالات طبية متنوعة، لا سيما في علم الأمراض وعلم الأورام، لتشخيص الأمراض وبحوث السرطان. تتطلب رقمنة أرشيفات علم الأمراض استخراج البيانات الوصفية تلقائيًا وتوحيدها لتعزيز قابلية استخدام WSIs لأغراض البحث وتدريب خوارزميات الذكاء الاصطناعي. تعتبر الجامعة الطبية في غراتس دراسة حالة، حيث تسلط الضوء على تعقيد وتنوع محتوى الشرائح عبر العديد من الحالات، مع عدد كبير من الشرائح لكل حالة، لا سيما في أعضاء معينة مثل البنكرياس.
تقترح الورقة نموذج بيانات وصفية مصمم لدمج البيانات الوصفية الجاهزة للذكاء الاصطناعي في أرشيفات WSI، مما يعزز علم الأمراض الرقمي. يتضمن هذا النموذج “خريطة أنسجة” منظمة تصنف المعلومات إلى ثلاث طبقات: المادة المصدرية، أنواع الأنسجة الشائعة، والتغيرات المرضية الملحوظة. من خلال إنشاء بيانات وصفية موحدة، يهدف النموذج إلى تحسين إدارة البيانات، والتوافق، والجودة العامة لمجموعات البيانات المستخدمة في تدريب الذكاء الاصطناعي. يسهل الإطار المقترح، WSIDOM، تصور خرائط الأنسجة ويدعم الاسترجاع الفعال لـ WSIs ذات الصلة، مما يعود بالنفع في النهاية على أبحاث السرطان وتطوير نماذج الذكاء الاصطناعي. توضح الورقة هيكلها، مع تفاصيل حول الأعمال ذات الصلة، والمنهجية، واستخراج البيانات الوصفية، وتطبيقات النموذج المقترح في الأقسام اللاحقة.
طرق
في هذا القسم، يصف الباحثون المنهجية المستخدمة في التقييم التجريبي لنموذج البيانات الوصفية الخاص بهم. تم استخدام المصنفات المدربة والمصادق عليها لتقسيم صور الشرائح الكاملة (WSIs) من مجموعة الاختبار، التي تم تقسيمها بشكل منهجي إلى رقع أصغر. خضعت كل رقعة للتصنيف، وتم متوسط التوقعات من الرقع المتداخلة لتعزيز الدقة. أشارت النتائج إلى أن دقة التوقع لكل مصنف ثنائي كانت مرتفعة بشكل ملحوظ. ومع ذلك، من المهم ملاحظة أن التقييم كان محدودًا بالمناطق المعلّمة، مما قد يؤدي إلى إغفال الحالات الحدودية في التقييم العام لـ WSIs.
نقاش
في هذا القسم، يناقش المؤلفون الأهمية المتزايدة لصور الشرائح الكاملة (WSIs) في بنوك الأنسجة والحاجة إلى آليات وصول بيانات متقدمة لإدارة كميات البيانات الهائلة المخزنة. تركز الطرق الحالية للبحث عن WSIs، مثل أطر التعلم العميق SMILY وYottixel، على التشابه البصري ولكن غالبًا ما تتطلب اختيار استعلام يدوي وتفتقر إلى قدرات بحث بيانات وصفية شاملة. يقترح المؤلفون نموذج بيانات وصفية جديد يستخدم خرائط الأنسجة متعددة الطبقات المنظمة لتعزيز البحث والتصفية عن WSIs بناءً على أوصاف بيانات وصفية مفصلة، مما يعالج قيود الطرق الحالية.
يتكون النموذج المقترح من ثلاث طبقات: مصدر المادة، أنواع الأنسجة، والتغيرات المرضية، كل منها مشفر بأنظمة ترميز دولية موحدة. يسمح هذا النهج المنظم بتصفية دقيقة وإنشاء مجموعات بيانات مخصصة، والتي تعتبر ضرورية لتقدم تطوير الذكاء الاصطناعي في علم الأمراض الرقمي. يقدم المؤلفون أيضًا إطار WSIDOM لتصور هذه الخرائط الأنسجة، مما يمكّن علماء الأمراض من تقييم واختيار WSIs ذات الصلة بسرعة بناءً على بياناتها الوصفية. من خلال دمج البيانات الوصفية الجاهزة للذكاء الاصطناعي في أرشيفات WSI، لا يسهل المعيار المقترح إدارة البيانات بكفاءة فحسب، بل يدعم أيضًا إنشاء مجموعات بيانات متوازنة ضرورية لتدريب وتقييم الذكاء الاصطناعي بشكل موثوق.
DOI: https://doi.org/10.1016/j.artmed.2026.103368
PMID: https://pubmed.ncbi.nlm.nih.gov/41610818
Publication Date: 2026-01-28
Author(s): Gernot Fiala et al.
Primary Topic: AI in cancer detection
Overview
This section presents a framework for generating 2D index maps, referred to as tissue maps, to enhance the metadata associated with Whole Slide Images (WSIs). WSIs are high-resolution digital images crucial for various medical fields, including pathology and oncology, but the lack of standardized metadata complicates their use in AI training and validation. The proposed framework organizes tissue maps into three layers: source material (organ), tissue types, and pathological alterations, allowing for a structured classification of WSI segments. This layered approach not only improves the search capabilities within WSI archives but also facilitates the assembly of high-quality, balanced datasets for AI applications.
The experimental evaluation demonstrates the interoperability of the metadata model through standardized syntax and semantics across different catalogs. By employing binary classifiers for automatic content extraction, the framework generates AI-ready metadata that reduces biases in training datasets. An open-source tool, WSIDOM, is introduced to support the visualization and conversion of annotations into tissue maps, making it adaptable for various research needs. Future work aims to enhance this framework by training a multi-class tissue segmentation model and implementing similarity search methods based on extracted metadata, thereby improving search performance and scalability across extensive WSI collections.
Introduction
The introduction of the paper discusses Whole Slide Images (WSIs), which are high-resolution digital representations of tissue samples obtained through biopsy or surgery. These images are increasingly utilized in various medical fields, particularly in pathology and oncology, for disease diagnosis and cancer research. The digitization of pathology archives necessitates automated metadata extraction and standardization to enhance the usability of WSIs for research and AI algorithm training. The Medical University of Graz serves as a case study, highlighting the complexity and variability of slide content across numerous cases, with a significant number of slides per case, particularly in specific organs like the pancreas.
The paper proposes a metadata model designed to integrate AI-ready metadata into WSI archives, thereby advancing digital pathology. This model includes a structured “tissue map” that categorizes information into three layers: the source material, common tissue types, and observed pathological alterations. By establishing standardized metadata, the model aims to improve data management, interoperability, and the overall quality of datasets used for AI training. The proposed framework, WSIDOM, facilitates the visualization of tissue maps and supports the efficient retrieval of relevant WSIs, ultimately benefiting cancer research and the development of AI models. The paper outlines its structure, detailing related work, methodology, metadata extraction, and applications of the proposed model in subsequent sections.
Methods
In this section, the researchers describe the methodology employed for the experimental evaluation of their metadata model. The trained and validated classifiers were utilized to segment whole slide images (WSIs) from the test set, which were systematically divided into smaller patches. Each patch underwent classification, and predictions from overlapping patches were averaged to enhance accuracy. The results indicated that the prediction accuracy of each binary classifier was notably high. However, it is important to note that the evaluation was limited to annotated areas, which may lead to the omission of border cases in the overall assessment of the WSIs.
Discussion
In this section, the authors discuss the increasing importance of Whole-Slide Images (WSIs) in biobanks and the need for advanced data access mechanisms to manage the vast amounts of data stored. Current methods for searching WSIs, such as the deep learning frameworks SMILY and Yottixel, focus on visual similarity but often require manual query selection and lack comprehensive metadata search capabilities. The authors propose a novel metadata model that utilizes structured multi-layer tissue maps to enhance search and filtering of WSIs based on detailed metadata descriptors, addressing the limitations of existing methods.
The proposed model comprises three layers: the source of the material, tissue types, and pathological alterations, each encoded with standardized international coding systems. This structured approach allows for fine-grained filtering and the creation of tailored datasets, which are crucial for advancing AI development in digital pathology. The authors also introduce the WSIDOM framework for visualizing these tissue maps, enabling pathologists to quickly assess and select relevant WSIs based on their metadata. By integrating AI-ready metadata into WSI archives, the proposed standard not only facilitates efficient data management but also supports the generation of balanced datasets essential for reliable AI training and validation.
