DOI: https://doi.org/10.1038/s41467-025-57072-6
PMID: https://pubmed.ncbi.nlm.nih.gov/39984438
تاريخ النشر: 2025-02-21
المؤلف: Peng Zhang وآخرون
الموضوع الرئيسي: تقنيات تحليل صور الخلايا
طرق
يستعرض قسم “الطرق” الأساليب التجريبية والتحليلية المستخدمة في الدراسة. يوضح تصميم التجارب، بما في ذلك اختيار الموضوعات، والمواد المستخدمة، والبروتوكولات المحددة المتبعة لضمان إمكانية التكرار. يتم وصف التحليلات الإحصائية، مع تسليط الضوء على التقنيات المستخدمة لتفسير البيانات، مثل تحليل الانحدار أو ANOVA، إلى جانب العتبات الدلالية المحددة لاختبار الفرضيات.
بالإضافة إلى ذلك، قد يتضمن القسم معلومات عن أي نماذج حسابية أو محاكاة تم استخدامها لدعم النتائج، فضلاً عن المعايير الخاصة بإدراج البيانات أو استبعادها. بشكل عام، تم هيكلة الطرق لتوفير إطار عمل واضح لفهم كيفية الحصول على النتائج ولتسهيل البحث المستقبلي في هذا المجال.
نتائج
يقدم قسم النتائج تطوير وتطبيق HistoCell، وهي طريقة ضعيفة الإشراف وخالية من التعليقات التوضيحية لتحليل صور علم الأنسجة للتنبؤ بالملفات المكانية للخلايا على مستوى النواة الفردية. يستخدم HistoCell نماذج مدربة مسبقًا تفصل ميزات الصورة عن التكوينات الخلوية، مما يمكّن من استخراج الميزات الشكلية والتوبولوجية للنوى. يتضمن هذا الترميز الهرمي معرفة سابقة حول تصنيفات الخلايا، مما يسمح بتمثيل شامل لأنواع وحالات الخلايا داخل مناطق الأنسجة. تم تدريب النماذج على بيانات النسخ الجزيئي المكاني (ST) المتاحة للجمهور من 99 عينة سرطان عبر تسعة أنواع من السرطان، بما في ذلك سرطان الثدي الغازي وسرطان خلايا الكلى، من بين أمور أخرى.
شملت المنهجية تحليل فك الارتباط لاشتقاق التكوينات الخلوية على مستوى النقاط، باستخدام أربع طرق متقدمة لفك الارتباط بالتزامن مع مجموعات بيانات تسلسل RNA أحادي الخلية (scRNA-seq) المتطابقة. صنف التحليل المكونات الخلوية واستنتج حالات الخلايا الظهارية، مما أدى إلى ملف خلوية هرمي لكل نقطة ST. بالإضافة إلى ذلك، تم إجراء استخراج ميزات الصورة باستخدام ResNet-18 ومحول انتباه الرسم البياني (GAT) لتحليل العلاقات المكانية والتوبولوجية بين النوى. تم إنشاء النماذج النهائية لـ HistoCell من خلال دمج هذه الميزات الهرمية مع التكوينات الخلوية المفككة كعلامات إشراف ضعيف، مما يسهل التنبؤ بأنواع وحالات الخلايا للنوى الفردية.
مناقشة
في هذا القسم، تناقش البحث أداء وموثوقية إطار عمل HistoCell للتنبؤ بأنواع الخلايا على مستوى النواة الفردية من صور علم الأنسجة عبر أنواع السرطان المختلفة. تم التحقق من صحة النموذج من خلال تحليلات التحقق المتبادل، مما أظهر ارتباطات كبيرة (p < 0.001) بين النسب الخلوية المتوقعة والأصلية المفككة لتسعة أنواع من السرطان. تفوق HistoCell على الخوارزمية الرائدة POLARIS، محققًا تحسينًا متوسطًا قدره 3.31 مرة في معاملات الارتباط بيرسون (PCC) عبر عينات سرطان الثدي والبروستاتا والكبد (p < 0.01). ومن الجدير بالذكر أن HistoCell حافظ على دقة تنبؤية عالية حتى لأنواع الخلايا ذات الوفرة المنخفضة، مثل خلايا T والخلايا النخاعية، التي تم التنبؤ بها بشكل غير كافٍ بواسطة POLARIS. كشفت تقييمات إضافية باستخدام مجموعة بيانات PanNuke أن تنبؤات HistoCell كانت متسقة بصريًا مع التعليقات التوضيحية اليدوية، محققة قيم المساحة تحت المنحنى (AUC) تبلغ 0.93 و0.89 و0.81 للخلايا الورمية والمناعية والستروما، على التوالي، متفوقة على كل من النماذج ذات الإشراف الضعيف والإشراف الكامل. تم تأكيد موثوقية النموذج عبر أحجام بيانات تدريب متغيرة، وتنوع الأورام، ودقة صور علم الأنسجة، مع أداء متسق بغض النظر عن عدد النقاط التدريبية أو طرق فك الارتباط المستخدمة. أشارت تحليلات الإزالة إلى أن دمج وحدات CNN وGAT وLSTM عزز بشكل كبير الأداء التنبؤي، مؤكدًا منطق تصميم HistoCell. بشكل عام، يظهر HistoCell قدرة قوية على فك الارتباط الخلوي عالي الدقة والتوصيف المكاني في صور علم الأنسجة، مما يوفر رؤى حاسمة حول بنية الأنسجة وعلم الأورام.
DOI: https://doi.org/10.1038/s41467-025-57072-6
PMID: https://pubmed.ncbi.nlm.nih.gov/39984438
Publication Date: 2025-02-21
Author(s): Peng Zhang et al.
Primary Topic: Cell Image Analysis Techniques
Methods
The “Methods” section outlines the experimental and analytical approaches employed in the study. It details the design of the experiments, including the selection of subjects, materials used, and the specific protocols followed to ensure reproducibility. Statistical analyses are described, highlighting the techniques utilized to interpret the data, such as regression analysis or ANOVA, along with the significance thresholds set for hypothesis testing.
Additionally, the section may include information on any computational models or simulations used to support the findings, as well as the criteria for data inclusion or exclusion. Overall, the methods are structured to provide a clear framework for understanding how the results were obtained and to facilitate future research in the field.
Results
The results section presents the development and application of HistoCell, a weakly-supervised and annotation-free method for analyzing histology images to predict cell spatial profiles at the individual nucleus level. HistoCell utilizes pre-trained models that decouple image features from cellular compositions, enabling the extraction of morphological and topological features of nuclei. This hierarchical encoding incorporates prior knowledge about cellular classifications, allowing for a comprehensive representation of cell types and states within tissue regions. The models were trained on publicly available spatial transcriptomics (ST) data from 99 cancer samples across nine cancer types, including breast invasive carcinoma and kidney renal cell carcinoma, among others.
The methodology involved deconvolution analysis to derive spot-level cellular compositions, using four advanced deconvolution methods in conjunction with matched single-cell RNA sequencing (scRNA-seq) datasets. The analysis categorized cellular compartments and inferred epithelial cell states, resulting in a hierarchical cellular profile for each ST spot. Additionally, image feature extraction was performed using ResNet-18 and a graph attention transformer (GAT) to analyze spatial and topological relationships among nuclei. The final HistoCell models were established by integrating these hierarchical features with deconvoluted cellular compositions as weak supervision labels, facilitating the prediction of cell types and states for individual nuclei.
Discussion
In this section, the research discusses the performance and robustness of the HistoCell framework for predicting single-nucleus-level cell types from histology images across various cancer types. The model was validated through cross-validation analyses, demonstrating significant correlations (p < 0.001) between predicted and original deconvoluted cell proportions for nine cancer types. HistoCell outperformed the state-of-the-art algorithm POLARIS, achieving an average enhancement of 3.31 times in Pearson correlation coefficients (PCC) across breast, prostate, and liver cancer samples (p < 0.01). Notably, HistoCell maintained high predictive accuracy even for low-abundance cell types, such as T cells and myeloid cells, which were inadequately predicted by POLARIS. Further evaluations using the PanNuke dataset revealed that HistoCell's predictions were visually consistent with manual annotations, achieving area under the curve (AUC) values of 0.93, 0.89, and 0.81 for tumor, immune, and stromal cells, respectively, outperforming both weakly-supervised and fully-supervised models. The model's robustness was confirmed across varying training data sizes, tumor heterogeneity, and histology image resolutions, with consistent performance regardless of the number of training spots or the deconvolution methods used. Ablation analyses indicated that the integration of CNN, GAT, and LSTM modules significantly enhanced predictive performance, affirming the rationality of HistoCell's design. Overall, HistoCell demonstrates a powerful capability for high-precision cellular deconvolution and spatial profiling in histology images, offering critical insights into tissue architecture and cancer biology.
