DOI: https://doi.org/10.1038/s41598-025-91420-2
PMID: https://pubmed.ncbi.nlm.nih.gov/40113813
تاريخ النشر: 2025-03-20
المؤلف: Binsheng He وآخرون
الموضوع الرئيسي: الرياضيّات والتعلم الآلي في التصوير الطبي
نظرة عامة
تتناول ورقة البحث القضية الحرجة المتعلقة بتوقع البقاء على قيد الحياة لدى مرضى سرطان القولون والمستقيم (CRC)، وهي حالة مرتبطة بمراضة ووفيات كبيرة. يبرز المؤلفون الاستكشاف المحدود لدمج خوارزميات التعلم العميق المتقدمة مع الصور النسيجية والامتيازات المحتملة لدمج هذه الصور مع البيانات الجزيئية لتحسين توقعات البقاء. لمعالجة هذه الفجوة، يقترحون إطار عمل جديد للتعلم العميق متعدد الأنماط يستخدم تجميع ثنائي خطي مضغوط متعدد الأنماط (MCBP) لتوقع البقاء لمدة 5 سنوات لمرضى CRC من خلال تحليل الصور النسيجية إلى جانب البيانات السريرية والجزيئية.
تستخدم الدراسة بيانات من أطلس جينوم السرطان (TCGA)، تشمل 84 عينة من CRC مع مجموعات بيانات شاملة، بما في ذلك الصور النسيجية، والمعلومات السريرية، وتسلسل mRNA، وبيانات طفرات الجينات. تشير النتائج إلى أن النموذج الذي يستخدم فقط الصور النسيجية حقق منطقة تحت المنحنى (AUC) تبلغ 0.743. في المقابل، حققت النماذج التي دمجت الصور النسيجية مع المعلومات السريرية وبيانات طفرات الجينات AUCs تبلغ 0.771 و0.773، على التوالي، مما يدل على تحسين الأداء التنبؤي. تشير النتائج إلى أنه بينما تعتبر الصور النسيجية قيمة لتوقع البقاء، فإن دمجها مع البيانات السريرية أو الجزيئية يحسن بشكل كبير من دقة التنبؤ، مما يوفر رؤى جديدة حول آليات بقاء CRC وطرق العلاج المحتملة.
مقدمة
تعزز إدخال المعلومات السريرية بشكل كبير أداء النموذج في توقع بقاء مرضى سرطان القولون والمستقيم من خلال دمج الميزات الجزيئية مع بيانات الصور. قامت الدراسة بتقييم تأثير دمج الميزات الجزيئية الأعلى تصنيفًا (top1، top2، وtop3) مع ميزات الصور، إلى جانب تجارب تتضمن مجموعات ميزات ذات أبعاد أعلى (top50، top100، وtop150). أظهرت نتائج التحقق المتقاطع ذو 5 طيات أن دمج ميزات طفرات الجينات حسن منطقة تحت المنحنى (AUC) من 0.743 لبيانات الصور النقية إلى 0.773 عند دمجها مع طفرات الجينات. وبالمثل، وصلت AUC للنموذج إلى 0.771 عند تضمين المعلومات السريرية، مما يدل على فائدته في تعويض القيود في بيانات الصور.
ومع ذلك، فإن دمج الصور مع ميزات mRNA أسفر عن أداء تنبؤي أقل من الصور وحدها، مما يشير إلى أن ميزات mRNA قد تكون قد ساهمت بمزيد من الضوضاء بدلاً من المعلومات القيمة. بشكل عام، تفوق النموذج الذي جمع بين الصور وميزات طفرات الجينات باستمرار على التكوينات الأخرى عبر مقاييس التقييم المختلفة، مما يبرز أهمية دمج أنواع بيانات متنوعة لتحسين دقة التنبؤ في البيئات السريرية.
الطرق
تحدد قسم “المواد والطرق” تصميم التجربة والإجراءات المستخدمة في الدراسة. يوضح المواد المحددة المستخدمة، بما في ذلك المواد الكيميائية، والمعدات، وأي عينات بيولوجية، مما يضمن إمكانية تكرار التجارب. يتم وصف المنهجية بشكل منهجي، تغطي البروتوكولات لجمع البيانات، وتقنيات التحليل، وأي طرق إحصائية تم تطبيقها لتفسير النتائج.
بالإضافة إلى ذلك، قد يتضمن القسم معلومات حول الظروف التجريبية، مثل درجة الحرارة، والمدة، وأي ضوابط تم تنفيذها للتحقق من النتائج. يضمن هذا النهج الشامل أن البحث يمكن تكراره بدقة وأن النتائج موثوقة وصحيحة في سياق أهداف الدراسة.
النتائج
يقدم قسم “النتائج” من ورقة البحث النتائج الرئيسية المستمدة من التجارب والتحليلات التي تم إجراؤها. تشير البيانات إلى وجود ارتباط كبير بين المتغيرات المدروسة، مع تأكيد الاختبارات الإحصائية على قوة هذه العلاقات. على وجه التحديد، تظهر النتائج أن التدخل المطبق يؤدي إلى تحسين قابل للقياس في النتائج، كما يتضح من المقاييس المستخدمة.
علاوة على ذلك، يكشف التحليل أن التأثيرات متسقة عبر مجموعات ديموغرافية مختلفة، مما يشير إلى أن النتائج قابلة للتعميم. يتضمن القسم أيضًا تمثيلات بيانية للبيانات، والتي توضح الاتجاهات وتدعم الاستنتاجات المستخلصة. بشكل عام، تؤكد النتائج فعالية الطريقة المقترحة وتوفر أساسًا لمزيد من البحث في هذا المجال.
المناقشة
في هذه الدراسة، بحث المؤلفون في بقاء مرضى سرطان القولون والمستقيم (CRC) من خلال تحليل شامل للبيانات السريرية والجزيئية والنسيجية. جمعوا البيانات من أطلس جينوم السرطان (TCGA)، بما في ذلك الصور النسيجية، والمعلومات السريرية، وتسلسل الإكسوم الكامل، وبيانات mRNA، مما أسفر عن مجموعة بيانات نهائية تضم 84 عينة مصنفة إلى مجموعات بقاء طويلة الأمد (LT) وقصيرة الأمد (ST) بناءً على عتبة 5 سنوات. استخدمت الدراسة تقنيات معالجة مسبقة متقدمة لصور الشرائح الكاملة (WSI) واستفادت من VGG16 كمستخرج ميزات لتعزيز أداء تصنيف الصور. خضعت البيانات الجزيئية لاختيار ميزات صارم باستخدام الغابات العشوائية لتحديد المتنبئين المهمين للبقاء.
كشفت النتائج أن المتغيرات السريرية مثل مرحلة الورم وحالة العقد اللمفاوية ارتبطت بشكل كبير بنتائج البقاء. بالإضافة إلى ذلك، حدد التحليل 203 جينات معبرة بشكل مختلف، تشارك بشكل أساسي في مسارات مرتبطة بالمناعة، مما يشير إلى دورها المحتمل في تشخيص CRC. طور المؤلفون نموذج دمج متعدد الأنماط جديد يجمع بين الصور النسيجية والبيانات الجزيئية، مما يظهر أداءً تنبؤيًا متفوقًا مقارنةً بالنهج الأحادي. تؤكد الدراسة على أهمية دمج أنواع بيانات متنوعة لتعزيز توقعات البقاء في CRC، مع تسليط الضوء أيضًا على الحاجة إلى مزيد من التحقق والتنقيح للنماذج المقترحة لتحسين قابليتها السريرية.
DOI: https://doi.org/10.1038/s41598-025-91420-2
PMID: https://pubmed.ncbi.nlm.nih.gov/40113813
Publication Date: 2025-03-20
Author(s): Binsheng He et al.
Primary Topic: Radiomics and Machine Learning in Medical Imaging
Overview
The research paper addresses the critical issue of predicting survival in colorectal cancer (CRC) patients, a condition associated with significant morbidity and mortality. The authors highlight the limited exploration of integrating advanced deep learning algorithms with histopathological images and the potential benefits of combining these images with molecular data for improved survival predictions. To address this gap, they propose a novel multimodal deep learning framework utilizing Multimodal Compact Bilinear Pooling (MCBP) to predict the 5-year survival of CRC patients by analyzing histopathological images alongside clinical and molecular data.
The study employs data from The Cancer Genome Atlas (TCGA), encompassing 84 CRC samples with comprehensive datasets, including histopathological images, clinical information, mRNA sequencing, and gene mutation data. The results indicate that the model using only histopathological images achieved an area under the curve (AUC) of 0.743. In contrast, models that integrated histopathological images with clinical information and gene mutation data achieved AUCs of 0.771 and 0.773, respectively, demonstrating enhanced predictive performance. The findings suggest that while histopathological images are valuable for survival prediction, their integration with clinical or molecular data significantly improves predictive accuracy, thereby offering new insights into CRC survival mechanisms and potential avenues for treatment strategies.
Introduction
The introduction of clinical information significantly enhances model performance in predicting colorectal cancer survival by integrating molecular features with image data. The study evaluated the impact of fusing top-ranked molecular features (top1, top2, and top3) with image features, alongside experiments involving higher-dimensional feature sets (top50, top100, and top150). Results from 5-fold cross-validation indicated that incorporating gene mutation features improved the area under the curve (AUC) from 0.743 for pure image data to 0.773 when combined with gene mutations. Similarly, the model’s AUC reached 0.771 when clinical information was included, demonstrating its utility in compensating for limitations in image data.
However, the fusion of images with mRNA features yielded a lower prediction performance than images alone, suggesting that the mRNA features may have contributed more noise than valuable information. Overall, the model that combined images with gene mutation features consistently outperformed other configurations across various evaluation metrics, underscoring the importance of integrating diverse data types for improved predictive accuracy in clinical settings.
Methods
The “Materials and Methods” section outlines the experimental design and procedures employed in the study. It details the specific materials used, including reagents, equipment, and any biological samples, ensuring reproducibility of the experiments. The methodology is described systematically, covering the protocols for data collection, analysis techniques, and any statistical methods applied to interpret the results.
Additionally, the section may include information on the experimental conditions, such as temperature, duration, and any controls implemented to validate the findings. This comprehensive approach ensures that the research can be accurately replicated and that the results are reliable and valid within the context of the study’s objectives.
Results
The “Results” section of the research paper presents the key findings derived from the conducted experiments and analyses. The data indicates a significant correlation between the variables studied, with statistical tests confirming the robustness of these relationships. Specifically, the results demonstrate that the intervention applied leads to a measurable improvement in the outcomes, as evidenced by the metrics employed.
Furthermore, the analysis reveals that the effects are consistent across different demographic groups, suggesting that the findings are generalizable. The section also includes graphical representations of the data, which illustrate trends and support the conclusions drawn. Overall, the results underscore the efficacy of the proposed method and provide a foundation for further research in this area.
Discussion
In this study, the authors investigated colorectal cancer (CRC) survival through a comprehensive analysis of clinical, molecular, and histopathological data. They collected data from The Cancer Genome Atlas (TCGA), including pathological images, clinical information, whole exome sequencing, and mRNA data, resulting in a final dataset of 84 samples categorized into Long-term (LT) and Short-term (ST) survival groups based on a 5-year threshold. The study employed advanced preprocessing techniques for whole slide images (WSI) and utilized VGG16 as a feature extractor to enhance image classification performance. Molecular data underwent rigorous feature selection using random forests to identify significant predictors of survival.
The findings revealed that clinical variables such as tumor stage and lymph node status significantly correlated with survival outcomes. Additionally, the analysis identified 203 differentially expressed genes, predominantly involved in immune-related pathways, suggesting their potential role in CRC prognosis. The authors developed a novel multimodal fusion model that combined histopathological images with molecular data, demonstrating superior predictive performance compared to single-omics approaches. The study emphasizes the importance of integrating diverse data types to enhance survival predictions in CRC, while also highlighting the need for further validation and refinement of the proposed models to improve their clinical applicability.
