DOI: https://doi.org/10.1038/s41375-026-02934-1
PMID: https://pubmed.ncbi.nlm.nih.gov/41872501
تاريخ النشر: 2026-03-23
المؤلف: Muhammed Furkan Dasdelen وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في اكتشاف السرطان
نظرة عامة
في هذه الدراسة، قدم المؤلفون cAItomorph، وهو نموذج قائم على المحولات مصمم لتصنيف الأورام الدموية باستخدام صور مسحات الدم المحيطي. أظهر النموذج دقة عالية في تحديد اللوكيميا الحادة، والأورام النقوية التناسلية، والتفريق بين الضوابط الصحية ضمن مجموعة مختبر تشخيصي. ومن الجدير بالذكر أن أداء cAItomorph تم التحقق منه خارجيًا، مما يشير إلى إمكانيته في تقليل عمليات سحب نخاع العظام غير الضرورية بنسبة تصل إلى 35% مع الحفاظ على الحساسية لتشخيص اللوكيميا الحادة. ومع ذلك، فإن تصميم الدراسة الاستعادي، والمركز الواحد، بالإضافة إلى اختلالات الفئات ومجموعة الضوابط الصحية المحدودة، يبرز الحاجة إلى تحقق متعدد المراكز مستقبلاً لتقييم الفائدة السريرية للنموذج بشكل كامل.
تشير النتائج إلى أن التشخيصات المعتمدة على الصور قدمت أداءً متفوقًا مقارنةً بالطرق التقليدية التي تعتمد على العد الخلوي التفريقي والمتغيرات الديموغرافية. حقق cAItomorph حساسية عالية لأنماط فرعية ذات ميزات شكلية مميزة، مثل اللوكيميا النقوية الحادة (AML)، واللوكيميا اللمفاوية الحادة (ALL)، واللوكيميا اللمفاوية المزمنة (CLL)، والصفائح الدموية الأساسية (ET)، واللوكيميا النقوية المزمنة (CML). بينما تمكن النموذج من تحديد المتبرعين الأصحاء بفعالية، واجه تحديات مع المرضى الذين يظهرون تغييرات تفاعلية وأظهر أداءً أقل للأمراض التي لا يتم تشخيصها عادةً من خلال الدم المحيطي، مثل اللمفوما. بشكل عام، يمثل cAItomorph أداة واعدة قائمة على الذكاء الاصطناعي للتصنيف التشخيصي الأولي في الأورام الدموية، مما قد يخفف الحاجة إلى إجراءات غازية مع الحفاظ على دقة التشخيص.
مقدمة
تسلط المقدمة الضوء على تعقيد الأورام الدموية، التي تنشأ من التكاثر والتمايز غير الطبيعي لخلايا الجذع والخلية السلفية في نخاع العظام. يتطلب التشخيص الدقيق مزيجًا من علم الخلايا الشكلية، والوراثة الجزيئية، والتصنيف المناعي، والتي يتم الحصول عليها عادةً من عينات الدم أو نخاع العظام. بينما يعتبر سحب نخاع العظام طريقة تشخيصية قياسية، فإن تحليل مسحات الدم المحيطي يوفر بديلاً أسرع وأقل غزوًا، مما يسمح بتقييم العد الخلوي التفريقي والعيوب الشكلية. ومع ذلك، فإن الطرق التقليدية لتحليل مسحات الدم تتطلب جهدًا كبيرًا وتكون عرضة لتباين الملاحظات بين المراقبين.
تشير الفقرة أيضًا إلى أن الأبحاث السابقة قد استكشفت تطبيق التعلم الآلي لتصنيف الخلايا الفردية واكتشاف الأمراض ضمن مجموعات مختارة. على الرغم من هذه التقدمات، لا يزال هناك فجوة في التقييمات النظامية لتقنيات التعلم الآلي عبر مختلف الأورام الدموية في بيئاتها السريرية الطبيعية، مما يشير إلى الحاجة لمزيد من الاستكشاف في هذا المجال.
طرق البحث
في هذه الدراسة، أجرى المؤلفون تحليلًا استعاديًا لصور خلايا الدم البيضاء الرقمية من مسحات الدم المحيطي لـ 6,610 فردًا، بما في ذلك 6,115 مريضًا و495 متبرعًا صحيًا من خلايا الجذع، تمت معالجتها في مختبر لوكيميا ميونيخ (MLL) بين عامي 2021 و2022. قاموا بتصنيف 168 علامة تشخيصية إلى 19 فئة مفصلة و8 فئات عامة من الأورام الدموية. لاستكمال تطوير النموذج، تم استبعاد المرضى بعد العلاج الكيميائي، مما أسفر عن مجموعة تدريب مكونة من 1,634 فردًا ومجموعة اختبار داخلية مكونة من 409. بالإضافة إلى ذلك، تم تقييم النموذج على 1,408 مرضى بتشخيصات غامضة.
لتسهيل التشخيص الأولي، استخدم الباحثون نموذج الأساس DinoBloom لتدريب نموذج ذكاء اصطناعي قائم على المحولات يسمى cAItomorph. يتنبأ هذا النموذج بالفئات العامة للأورام الدموية من صور خلايا الدم الفردية لمسوحات الدم المحيطي. يعمل نموذج cAItomorph في ثلاث مراحل: (i) يقوم مشفر DinoBloom باستخراج 768 ميزة من صور خلايا الدم البيضاء الفردية، (ii) يجمع مجمع المحولات المعلومات من 500 خلية في تمثيل واحد بُعده 512، و(iii) يولد مصنف احتمالات لكل من الفئات الثمانية. تم تدريب النموذج باستخدام التحقق المتقاطع ذو الخمس طيات، وتم دمج التنبؤات من خمسة نماذج من خلال التجميع للتقييم على مجموعة اختبار محجوزة.
النتائج
تظهر نتائج الدراسة أن نموذج cAItomorph يظهر حساسية ودقة عالية لتشخيص اللوكيميا الحادة (الحساسية: 0.74، الدقة: 0.79) والأورام النقوية التناسلية (MPN) (الحساسية: 0.85، الدقة: 0.76)، بينما يظهر أداءً معتدلاً لمتلازمات خلل تكوين الدم (MDS) (الحساسية: 0.71، الدقة: 0.57). ومن الجدير بالذكر أن النموذج حقق حساسية مفاجئة تبلغ 0.77 للأورام البلازمية، على الرغم من عدم اكتشافها عادةً في مسحات الدم. تم الإبلاغ عن دقة النموذج العامة عند 0.72، مع دقة من أعلى نقطتين تبلغ 0.87. تتماشى تنبؤات النموذج بشكل جيد مع احتمالات المرض الحقيقية، كما يتضح من خطأ المعايرة المتوقع بنسبة 2.4% ومعامل ارتباط بيرسون الكبير البالغ 0.67 للقيم المتوقعة مقابل القيم المقاسة للهيموغلوبين.
علاوة على ذلك، يقلل النموذج بشكل فعال من عمليات سحب نخاع العظام غير الضرورية من 13.5% إلى 8.7% مع الحفاظ على حساسية 100% لحالات اللوكيميا الحادة من خلال تعديل عتبة الأورام. في تحليل الفئات التفصيلية، حقق cAItomorph حساسية تبلغ 0.70 للوكيميا النقوية الحادة (AML) وصنف بشكل صحيح 11 من أصل 12 حالة MPN. كما أظهر النموذج قدرة قوية على التعميم عبر مجموعات البيانات الخارجية، محققًا حساسية تبلغ 0.94 للوكيميا الحادة في مجموعة بيانات AML-Hehr وحساسية 1.0 لاكتشاف الأورام في مجموعة بيانات APL-AML. تبرز الدراسة الفائدة السريرية للنموذج من خلال التصورات التفاعلية التي توضح انتباه الخلايا على المستوى الخلوي، مما يعزز دقة التشخيص لمختلف الأورام الدموية.
المناقشة
في هذا القسم، يقدم المؤلفون النتائج من دراستهم حول cAItomorph، وهو نموذج قائم على المحولات مصمم لتصنيف الأورام الدموية باستخدام مسحات الدم المحيطي. أظهر النموذج دقة عالية في تشخيص اللوكيميا الحادة، والأورام النقوية التناسلية، والتفريق بين الضوابط الصحية، مع أداء قوي تم التحقق منه عبر مجموعات خارجية. ومن الجدير بالذكر أن cAItomorph لديه القدرة على تقليل عمليات سحب نخاع العظام غير الضرورية بنسبة تصل إلى 35% مع الحفاظ على الحساسية لاكتشاف اللوكيميا الحادة، على الرغم من الحاجة إلى تحقق مستقبلي إضافي لتأكيد هذه النتائج في البيئات السريرية.
تسلط المناقشة الضوء على الأداء المتفوق للنموذج مقارنةً بالطرق التقليدية المعتمدة على العد الخلوي التفريقي والعوامل الديموغرافية. ومع ذلك، تعترف بالقيود مثل الطبيعة الاستعادية للدراسة، واختلالات الفئات التي تؤثر على اكتشاف الأمراض النادرة، ومجموعة الضوابط الصحية المحدودة لمتبرعي خلايا الجذع. على الرغم من هذه التحديات، يظهر cAItomorph وعدًا كأداة مكملة للتصنيف التشخيصي الأولي في الأورام الدموية، مما قد يخفف الحاجة إلى إجراءات غازية مع ضمان دقة التشخيص. ترتبط قدرة النموذج على التنبؤ بالأورام الدموية بنسب خلايا الدم المحددة، مما يعزز قدراته التشخيصية بشكل أكبر.
DOI: https://doi.org/10.1038/s41375-026-02934-1
PMID: https://pubmed.ncbi.nlm.nih.gov/41872501
Publication Date: 2026-03-23
Author(s): Muhammed Furkan Dasdelen et al.
Primary Topic: AI in cancer detection
Overview
In the study, the authors introduced cAItomorph, a transformer-based model designed for the classification of hematological malignancies using peripheral blood smear images. The model demonstrated high accuracy in identifying acute leukemias, myeloproliferative neoplasms, and distinguishing healthy controls within a diagnostic laboratory cohort. Notably, cAItomorph’s performance was validated externally, suggesting its potential to reduce unnecessary bone marrow aspirations by up to 35% while maintaining sensitivity for acute leukemia diagnoses. However, the study’s retrospective, single-center design, along with class imbalances and a limited healthy control group, highlight the need for prospective multi-center validation to fully assess the model’s clinical utility.
The findings indicate that image-based diagnostics provided superior performance compared to traditional methods relying on differential cell counts and demographic variables. cAItomorph achieved high sensitivity for subtypes with distinct morphological features, such as acute myeloid leukemia (AML), acute lymphoblastic leukemia (ALL), chronic lymphocytic leukemia (CLL), essential thrombocythemia (ET), and chronic myeloid leukemia (CML). While the model effectively identified healthy donors, it faced challenges with patients exhibiting reactive changes and showed lower performance for diseases not typically diagnosed through peripheral blood, such as lymphoma. Overall, cAItomorph represents a promising AI-based tool for initial diagnostic triage in hematological malignancies, potentially alleviating the need for invasive procedures while preserving diagnostic accuracy.
Introduction
The introduction highlights the complexity of hematological malignancies, which stem from the abnormal proliferation and differentiation of hematopoietic stem and progenitor cells in the bone marrow. Accurate diagnosis necessitates a combination of cytomorphology, molecular genetics, and immunophenotyping, typically derived from blood or bone marrow samples. While bone marrow aspiration is a standard diagnostic method, peripheral blood smear analysis offers a quicker and less invasive alternative, allowing for the assessment of differential cell counts and morphological abnormalities. However, traditional methods of analyzing blood smears are labor-intensive and prone to interobserver variability.
The section also notes that prior research has investigated the application of machine learning for single-cell classification and disease detection within curated cohorts. Despite these advancements, there remains a gap in systematic evaluations of machine learning techniques across various hematological malignancies in their natural clinical settings, indicating a need for further exploration in this area.
Methods
In this study, the authors conducted a retrospective analysis of digitized white blood cell images from peripheral blood smears of 6,610 individuals, including 6,115 patients and 495 healthy stem cell donors, processed at the Munich Leukemia Laboratory (MLL) between 2021 and 2022. They categorized 168 diagnostic labels into 19 detailed and 8 coarse classes of hematological malignancies. For model development, post-chemotherapy patients were excluded, resulting in a training set of 1,634 individuals and an internal testing set of 409. Additionally, the model was evaluated on 1,408 patients with ambiguous diagnoses.
To facilitate initial diagnosis, the researchers employed the DinoBloom foundation model to train a transformer-based AI model named cAItomorph. This model predicts coarse classes of hematological malignancies from single-cell images of peripheral blood smears. The cAItomorph model operates in three stages: (i) the DinoBloom encoder extracts 768 features from individual white blood cell images, (ii) a transformer aggregator synthesizes information from 500 cells into a single 512-dimensional representation, and (iii) a classifier generates probabilities for each of the eight classes. The model was trained using 5-fold cross-validation, and predictions from five models were combined through ensembling for evaluation on a held-out test set.
Results
The results of the study demonstrate that the cAItomorph model exhibits high sensitivity and precision for diagnosing acute leukemia (sensitivity: 0.74, precision: 0.79) and myeloproliferative neoplasms (MPN) (sensitivity: 0.85, precision: 0.76), while showing moderate performance for myelodysplastic syndromes (MDS) (sensitivity: 0.71, precision: 0.57). Notably, the model achieved a surprising sensitivity of 0.77 for plasma cell neoplasms, despite their typical undetectability in blood smears. The overall model accuracy was reported at 0.72, with a top-2 accuracy of 0.87. The model’s predictions align well with true disease probabilities, evidenced by an expected calibration error of 2.4% and a significant Pearson correlation coefficient of 0.67 for predicted versus measured hemoglobin values.
Furthermore, the model effectively reduces unnecessary bone marrow aspirations from 13.5% to 8.7% while maintaining 100% sensitivity for acute leukemia cases by adjusting the malignancy threshold. In detailed class analysis, cAItomorph achieved a sensitivity of 0.70 for acute myeloid leukemia (AML) and correctly classified 11 out of 12 MPN cases. The model also demonstrated strong generalizability across external datasets, achieving a sensitivity of 0.94 for acute leukemias in the AML-Hehr dataset and a 1.0 sensitivity for malignancy detection in the APL-AML dataset. The study highlights the model’s clinical utility through interactive visualizations that illustrate cell-level attention, enhancing diagnostic accuracy for various hematological malignancies.
Discussion
In this section, the authors present the findings from their study on cAItomorph, a transformer-based model designed for the classification of hematological malignancies using peripheral blood smears. The model demonstrated high accuracy in diagnosing acute leukemias, myeloproliferative neoplasms, and distinguishing healthy controls, with strong performance validated across external cohorts. Notably, cAItomorph has the potential to reduce unnecessary bone marrow aspirations by up to 35% while maintaining sensitivity for acute leukemia detection, although further prospective validation is necessary to confirm these results in clinical settings.
The discussion highlights the model’s superior performance compared to traditional methods based on differential cell counts and demographic factors. However, it acknowledges limitations such as the retrospective nature of the study, class imbalances affecting rare disease detection, and a healthy control group limited to stem cell donors. Despite these challenges, cAItomorph shows promise as a complementary tool for initial diagnostic triage in hematological malignancies, potentially alleviating the need for invasive procedures while ensuring diagnostic accuracy. The model’s ability to predict hematological malignancies correlates with specific blood cell ratios, further enhancing its diagnostic capabilities.
