تقييم علم الأورام الدقيق المدفوع بالذكاء الاصطناعي لسرطان الثدي في البلدان ذات الدخل المنخفض والمتوسط: مراجعة لأداء التعلم الآلي، واستخدام البيانات الجينومية، والجدوى السريرية
Evaluating AI-driven precision oncology for breast cancer in low- and middle-income countries: a review of machine learning performance, genomic data use, and clinical feasibility

المجلة: Frontiers in Digital Health، المجلد: 7
DOI: https://doi.org/10.3389/fdgth.2025.1702339
PMID: https://pubmed.ncbi.nlm.nih.gov/41550348
تاريخ النشر: 2026-01-02
المؤلف: Luis Fabián Salazar-Garcés وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في اكتشاف السرطان

نظرة عامة

يوفر قسم ورقة البحث نظرة عامة على استخدام أنظمة الذكاء الاصطناعي (AI) في اتخاذ قرارات علاج سرطان الثدي، خاصة في البلدان ذات الدخل المنخفض والمتوسط (LMICs). يسلط الضوء على الاعتماد المتزايد على الذكاء الاصطناعي، مع الإشارة إلى التحديات المتعلقة بالعمومية والعدالة للنماذج عالية الأداء، خاصة تلك المدربة على مجموعات بيانات مثل أطلس جينوم السرطان (TCGA). أجرى المؤلفون مراجعة شاملة لـ 497 سجلًا، وحددوا 43 دراسة ذات صلة، 34 منها أبلغت عن مقاييس كمية. تشير النتائج الرئيسية إلى أن أنظمة توصية العلاج تظهر معدلات توافق تتراوح بين 67% و97% في سرطان الثدي في مراحله المبكرة، ولكن الأداء ينخفض بشكل كبير في الحالات النقيليّة. غالبًا ما تحقق النماذج التنبؤية والمتعددة الوسائط قيم منطقة تحت المنحنى (AUC) تتراوح بين 0.90 و0.99، على الرغم من أن النماذج الجينومية المدربة في البلدان ذات الدخل المرتفع أظهرت فعالية منخفضة عند التحقق منها في سياقات LMIC.

تؤكد الخاتمة على أنه بينما تظهر أنظمة دعم القرار المدفوعة بالذكاء الاصطناعي أداءً تقنيًا قويًا، خاصة في الأمراض في مراحلها المبكرة، فإن تطبيقها في LMICs يعيقه القيود المنهجية والاعتماد على مجموعات بيانات البلدان ذات الدخل المرتفع. يبرز الانخفاض الملحوظ في الأداء عند تطبيق النماذج المدربة في HIC على سكان LMIC الحاجة إلى مجموعات بيانات محلية المعايرة وتعديلات حساسة للسياق. تعتبر الاعتبارات الأخلاقية، مثل حوكمة البيانات الجينومية والتحيز الخوارزمي، حاسمة في سياقات LMIC، حيث قد تتفاقم الفجوات القائمة. يدعو المؤلفون إلى تحسين منهجي صارم، واستثمار في نظم بيانات LMIC، وأطر حوكمة لضمان الوصول العادل والابتكار المسؤول في الأورام المدعومة بالذكاء الاصطناعي، مما قد يعزز في النهاية اتخاذ القرارات السريرية ويحسن نتائج سرطان الثدي على مستوى العالم.

مقدمة

تسلط مقدمة ورقة البحث الضوء على القضية الملحة لسرطان الثدي، الذي يُعد أكثر أنواع السرطان تشخيصًا وأحد الأسباب الرئيسية للوفيات المرتبطة بالسرطان بين النساء على مستوى العالم، خاصة في البلدان ذات الدخل المنخفض والمتوسط (LMICs). غالبًا ما تفشل عمليات اتخاذ القرار التقليدية في العلاج في أخذ التنوع الجزيئي والسريري لسرطان الثدي في الاعتبار، خاصة في البيئات ذات الموارد المحدودة حيث تكون الموارد التشخيصية والعلاجية نادرة. تفترض الورقة أن الذكاء الاصطناعي (AI) لديه القدرة على تعزيز الأورام الدقيقة من خلال نماذج مختلفة، بما في ذلك أنظمة توصية العلاج، والنماذج التنبؤية، ونماذج التصنيف التشخيصي التي تستخدم بيانات متعددة الوسائط لإبلاغ قرارات العلاج المعقدة.

ومع ذلك، تحدد الورقة تحديات كبيرة في تطبيق الذكاء الاصطناعي في LMICs، خاصة فيما يتعلق بالصلاحية الخارجية للنماذج المدربة على مجموعات بيانات البلدان ذات الدخل المرتفع (HIC). لوحظ انخفاض مستمر في أداء النماذج عندما يتم التحقق منها في مجموعات LMIC، ويعزى ذلك إلى الاختلافات في وراثة السكان، والبنية التحتية التشخيصية، وتوافر العلاجات. تؤكد المراجعة على ضرورة توليد البيانات والتحقق منها وفقًا للمنطقة لضمان أن تكون أنظمة دعم القرار المدفوعة بالذكاء الاصطناعي فعالة وعادلة عبر بيئات الرعاية الصحية المتنوعة. بشكل عام، بينما يحمل الذكاء الاصطناعي وعدًا لتحسين اتخاذ القرارات الأورامية، فإن فعاليته تتأثر بشدة بتعقيد المرض، ومصدر البيانات، والخصائص الهيكلية لأنظمة الرعاية الصحية التي يتم تنفيذ هذه الأدوات فيها.

الطرق

يستعرض قسم “المواد والطرق” التصميم التجريبي والإجراءات المستخدمة في الدراسة. يوضح المواد المحددة المستخدمة، بما في ذلك أي مواد كيميائية، ومعدات، وعينات بيولوجية، مما يضمن إمكانية تكرار التجارب. تشمل المنهجية البروتوكولات المتبعة لجمع البيانات، بما في ذلك أي تحليلات إحصائية تم إجراؤها لتفسير النتائج.

بالإضافة إلى ذلك، قد يصف القسم الإعداد التجريبي، مثل مجموعات التحكم والعلاج، وكذلك الظروف التي أجريت فيها التجارب. يسمح هذا النهج الشامل بفهم واضح لكيفية اشتقاق النتائج ويدعم صحة الاستنتاجات المستخلصة في الدراسة.

النتائج

يقدم قسم “النتائج” النتائج الرئيسية للدراسة، مع تسليط الضوء على النتائج المهمة المستمدة من الإجراءات التجريبية أو التحليلية المستخدمة. تشير البيانات إلى وجود ارتباط واضح بين المتغيرات قيد البحث، مع تأكيد التحليلات الإحصائية على قوة هذه العلاقات. من الجدير بالذكر أن النتائج تظهر أن التدخل المطبق يؤدي إلى تحسين ملحوظ في النتائج المقاسة، كما يتضح من المقاييس الكمية المبلغ عنها.

علاوة على ذلك، يكشف التحليل أن ظروفًا أو معايير معينة تؤثر بشكل كبير على فعالية التدخل، مما يقترح طرقًا محتملة لمزيد من البحث. تدعم النتائج تمثيلات بصرية، مثل الرسوم البيانية أو الجداول، التي توضح الاتجاهات والتغيرات الملحوظة في البيانات. بشكل عام، تسهم النتائج في تقديم رؤى قيمة في هذا المجال، مما يعزز النظريات القائمة بينما يقترح أيضًا فرضيات جديدة للاستكشاف المستقبلي.

المناقشة

هدفت المراجعة المدعومة بالذكاء الاصطناعي إلى تقييم أداء وجدوى أدوات الذكاء الاصطناعي (AI) وتعلم الآلة (ML) في دعم اتخاذ قرارات العلاج لسرطان الثدي، خاصة في البلدان ذات الدخل المنخفض والمتوسط (LMICs). التزمت الدراسة بمعايير تجميع الأدلة المعمول بها، بما في ذلك PRISMA 2020 وPROBAST-AI، وشملت استراتيجية بحث شاملة تجمع بين الاستعلامات التقليدية باستخدام Boolean مع الاسترجاع الدلالي المدعوم بالذكاء الاصطناعي عبر قواعد بيانات متعددة. تم تحديد ما مجموعه 497 سجلًا فريدًا، مع 43 دراسة تلبي معايير الإدراج، تركز على أنظمة الذكاء الاصطناعي التي تولد توصيات العلاج أو تتنبأ بنتائج قابلة للتنفيذ سريريًا.

كشفت النتائج عن تباين كبير في أداء الذكاء الاصطناعي بناءً على مرحلة المرض وهندسة النموذج. أظهرت أنظمة توصية العلاج توافقًا عاليًا مع قرارات الخبراء السريرية في سرطان الثدي في مراحله المبكرة، بينما انخفض الأداء بشكل ملحوظ في الحالات النقيليّة، مما يبرز التحديات في ترميز القرارات السريرية المعقدة ضمن أطر صارمة. عمومًا، أظهرت نماذج تعلم الآلة والتعلم العميق أداءً تمييزيًا متفوقًا، خاصة عند استخدام البيانات الجينومية، لكنها كانت حساسة للتغيرات في المجال عند تطبيقها في سياقات LMIC. كما حددت المراجعة تباينًا منهجيًا كبيرًا ومخاطر التحيز عبر الدراسات، مما يبرز الحاجة إلى تحقق خارجي صارم وإبلاغ شفاف لتعزيز قابلية تطبيق أدوات الذكاء الاصطناعي في بيئات الرعاية الصحية المتنوعة. بشكل عام، تؤكد المراجعة على إمكانيات الذكاء الاصطناعي في اتخاذ قرارات علاج سرطان الثدي بينما تدعو إلى مزيد من البحث لمعالجة القيود الحالية وتحسين التنفيذ في البيئات ذات الموارد المحدودة.

القيود

تقدم المراجعة عدة قيود يجب الاعتراف بها عند تفسير نتائجها. أولاً، تتكون قاعدة الأدلة بشكل أساسي من تحليلات استعادية، مع وجود دراستين فقط تتضمنان عناصر استباقية. هذا يحد من القدرة على تقييم التأثير الواقعي لتوصيات الذكاء الاصطناعي على نتائج مثل الالتزام بالعلاج، وإدارة السمية، والبقاء بدون تقدم (PFS)، والبقاء العام (OS). بينما يعتبر التوافق مع لجان الأورام متعددة التخصصات بمثابة بديل عملي للفائدة السريرية، فإنه يظل مقياسًا غير مباشر.

ثانيًا، أدت التباين الكبير في هندسة النماذج، وطرق البيانات، وأطر التحقق، وتعريفات النقاط النهائية إلى عرقلة التحليل التلوي، مما استلزم بدلاً من ذلك تجميع سردي. تعقيد المقاييس الأداء (مثل منطقة تحت المنحنى (AUC)، ومؤشر C، والتوافق) والتحقق الخارجي غير المتسق يعقد المقارنات عبر الدراسات، مما قد يضخم تقديرات الأداء، خاصة في التحليلات الجينومية والإشعاعية عالية الأبعاد. علاوة على ذلك، على الرغم من التركيز على البلدان ذات الدخل المنخفض والمتوسط (LMIC)، فإن الأدبيات تتأثر بشدة بمجموعات بيانات من البيئات ذات الدخل المرتفع، حيث تظهر المؤشرات الجينومية عالية الأداء غالبًا انخفاضًا متسقًا في الأداء عند التحقق منها في مجموعات LMIC. يبرز هذا التفاوت الفجوات العالمية في الوصول إلى بيانات متعددة الوسائط عالية الجودة، مما يحد من عمومية أنظمة الذكاء الاصطناعي الحالية. أخيرًا، تعقيد عدم الاتساق في الإبلاغ عن التفاصيل المنهجية الرئيسية والتحيزات المحتملة المتعلقة بالإفصاحات التمويلية يزيد من تعقيد تقييم جودة الدراسات المراجعة. تؤكد هذه القيود على ضرورة إجراء تقييمات مصممة بشكل استباقي، ومبلغ عنها بشفافية لأنظمة دعم القرار المعتمدة على الذكاء الاصطناعي، خاصة في سياقات LMIC حيث تعتبر جودة البيانات والوصول العادل أمرين حاسمين.

Journal: Frontiers in Digital Health, Volume: 7
DOI: https://doi.org/10.3389/fdgth.2025.1702339
PMID: https://pubmed.ncbi.nlm.nih.gov/41550348
Publication Date: 2026-01-02
Author(s): Luis Fabián Salazar-Garcés et al.
Primary Topic: AI in cancer detection

Overview

The research paper section provides an overview of the use of artificial intelligence (AI) systems in breast cancer treatment decision-making, particularly in low- and middle-income countries (LMICs). It highlights the increasing reliance on AI, while noting the challenges related to the generalizability and equity of high-performing models, especially those trained on datasets like The Cancer Genome Atlas (TCGA). The authors conducted a scoping review of 497 records, identifying 43 relevant studies, 34 of which reported quantitative metrics. Key findings indicate that treatment-recommendation systems exhibit concordance rates between 67% and 97% in early-stage breast cancer, but performance declines significantly in metastatic cases. Prognostic and multimodal models often achieved area under the curve (AUC) values between 0.90 and 0.99, although HIC-trained genomic models showed reduced effectiveness when validated in LMIC contexts.

The conclusion emphasizes that while AI-driven decision-support systems demonstrate strong technical performance, particularly in early-stage disease, their application in LMICs is hindered by methodological limitations and a reliance on high-income country datasets. The observed performance drop when applying HIC-trained models to LMIC populations underscores the need for locally calibrated datasets and context-sensitive adaptations. Ethical considerations, such as genomic data governance and algorithmic bias, are critical in LMIC settings, where existing disparities may be exacerbated. The authors advocate for rigorous methodological refinement, investment in LMIC data ecosystems, and governance frameworks to ensure equitable access and responsible innovation in AI-supported oncology, which could ultimately enhance clinical decision-making and improve global breast cancer outcomes.

Introduction

The introduction of the research paper highlights the pressing issue of breast cancer, which is the most commonly diagnosed cancer and a leading cause of cancer-related mortality among women globally, particularly in low- and middle-income countries (LMICs). Traditional treatment decision-making processes often fail to account for the molecular and clinical diversity of breast cancer, especially in resource-limited settings where diagnostic and therapeutic resources are scarce. The paper posits that artificial intelligence (AI) has the potential to enhance precision oncology through various models, including treatment-recommendation systems, prognostic models, and diagnostic subtyping models that utilize multimodal data to inform complex treatment decisions.

However, the paper identifies significant challenges in the application of AI in LMICs, particularly concerning the external validity of models trained on high-income country (HIC) datasets. A consistent decline in model performance is observed when these models are validated in LMIC cohorts, attributed to differences in population genetics, diagnostic infrastructure, and therapeutic availability. The review underscores the necessity for region-specific data generation and validation to ensure that AI-driven decision-support systems are effective and equitable across diverse healthcare environments. Overall, while AI holds promise for improving oncologic decision-making, its efficacy is heavily influenced by the complexity of the disease, the provenance of the data, and the structural characteristics of the healthcare systems in which these tools are implemented.

Methods

The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the specific materials used, including any reagents, equipment, and biological samples, ensuring reproducibility of the experiments. The methodology encompasses the protocols followed for data collection, including any statistical analyses performed to interpret the results.

Additionally, the section may describe the experimental setup, such as control and treatment groups, as well as the conditions under which the experiments were conducted. This comprehensive approach allows for a clear understanding of how the findings were derived and supports the validity of the conclusions drawn in the study.

Results

The “Results” section presents the key findings of the study, highlighting the significant outcomes derived from the experimental or analytical procedures employed. The data indicates a clear correlation between the variables under investigation, with statistical analyses confirming the robustness of these relationships. Notably, the results demonstrate that the intervention applied leads to a marked improvement in the measured outcomes, as evidenced by the quantitative metrics reported.

Furthermore, the analysis reveals that certain conditions or parameters significantly influence the effectiveness of the intervention, suggesting potential avenues for further research. The findings are supported by visual representations, such as graphs or tables, which illustrate the trends and variations observed in the data. Overall, the results contribute valuable insights into the field, reinforcing existing theories while also proposing new hypotheses for future exploration.

Discussion

The AI-assisted scoping review aimed to evaluate the performance and feasibility of artificial intelligence (AI) and machine learning (ML) tools in supporting treatment decision-making for breast cancer, particularly in low- and middle-income countries (LMICs). The study adhered to established evidence synthesis standards, including PRISMA 2020 and PROBAST-AI, and involved a comprehensive search strategy that combined traditional Boolean queries with AI-assisted semantic retrieval across multiple databases. A total of 497 unique records were identified, with 43 studies meeting the inclusion criteria, focusing on AI systems that generate treatment recommendations or predict clinically actionable outcomes.

The findings revealed significant variability in AI performance based on disease stage and model architecture. Treatment-recommendation systems demonstrated high concordance with expert clinical decisions in early-stage breast cancer, while performance declined markedly in metastatic cases, highlighting the challenges of encoding complex clinical decisions within rigid frameworks. ML and deep learning models generally exhibited superior discriminative performance, particularly when utilizing genomic data, but were sensitive to domain shifts when applied to LMIC contexts. The review also identified substantial methodological variability and risk of bias across studies, emphasizing the need for rigorous external validation and transparent reporting to enhance the applicability of AI tools in diverse healthcare settings. Overall, the review underscores the potential of AI in breast cancer treatment decision-making while calling for further research to address existing limitations and improve implementation in resource-constrained environments.

Limitations

The review presents several limitations that must be acknowledged when interpreting its findings. Firstly, the evidence base is predominantly composed of retrospective analyses, with only two studies incorporating prospective elements. This restricts the ability to evaluate the real-world impact of AI-generated recommendations on outcomes such as treatment adherence, toxicity management, progression-free survival (PFS), and overall survival (OS). While concordance with multidisciplinary tumor boards serves as a practical surrogate for clinical utility, it remains an indirect measure.

Secondly, the significant heterogeneity in model architectures, data modalities, validation frameworks, and endpoint definitions hindered meta-analysis, necessitating a narrative synthesis instead. Variability in performance metrics (e.g., area under the curve (AUC), C-index, concordance) and inconsistent external validation complicate cross-study comparisons, potentially inflating performance estimates, especially in high-dimensional genomic and radiomic analyses. Furthermore, despite focusing on low- and middle-income countries (LMIC), the literature is heavily influenced by datasets from high-income settings, with high-performing genomic predictors often validated in LMIC cohorts showing consistent performance declines. This disparity highlights global inequities in access to quality multimodal data, limiting the generalizability of current AI systems. Lastly, inconsistencies in reporting key methodological details and potential biases related to funding disclosures further complicate the quality appraisal of the studies reviewed. These limitations emphasize the necessity for prospectively designed, transparently reported evaluations of AI-based decision-support systems, particularly in LMIC contexts where data quality and equitable access are critical.