DOI: https://doi.org/10.1038/s41592-025-02857-2
PMID: https://pubmed.ncbi.nlm.nih.gov/41145665
تاريخ النشر: 2025-10-27
المؤلف: Minji Kang وآخرون
الموضوع الرئيسي: علم النسخ الجيني أحادي الخلية والمكاني
طرق
في هذا القسم، يوضح المؤلفون المنهجيات المستخدمة لمقارنة CytoTRACE 2 مع مجموعة متنوعة من أساليب التعلم الآلي المراقب لتوقع نوع الخلية واستنتاج الإمكانات التنموية. قاموا بتقييم CytoTRACE 2 جنبًا إلى جنب مع ثلاث طرق متخصصة في توضيح الخلايا المفردة (scPred وSingleCellNet وscmap) وخمسة مصنفات عامة. شمل التقييم التدريب والاختبار عبر أربع طيات، بما في ذلك تقسيمات عشوائية لأطلس القدرة الخلوية المفردة، مع تقييم مقاييس الأداء باستخدام متوسط درجة F1 متعددة الفئات ومتوسط الخطأ المطلق (MAE). تم معالجة بيانات التعبير في فضاء ميزات موحد، وتم تطبيعها باستخدام CPM/TPM تليها تحويل log2، وتم توحيدها إلى متوسط صفر وتباين وحدة، مع طرق تطبيع بديلة تؤدي إلى نتائج أدنى.
بالإضافة إلى ذلك، قارن المؤلفون CytoTRACE 2 مع ثماني طرق موجودة لتوقع الإمكانات التنموية من بيانات تسلسل RNA للخلايا المفردة (scRNA-seq)، باستخدام ما يقرب من 19,000 مجموعة جينية موضحة. تم إجراء التحليل دون تصحيح الدفعات أو دمج مجموعات البيانات، وتم تطبيع بيانات التعبير وفقًا لتوصيات كل طريقة. من أجل التحقق التجريبي، وصف المؤلفون عزل أنواع مختلفة من خلايا الجذع والخلية السلفية من فئران C57BL/6 باستخدام قياس التدفق، موضحين الأجسام المضادة والبروتوكولات المحددة المستخدمة. تهدف هذه المنهجية الشاملة إلى تقييم أداء CytoTRACE 2 بدقة وتطبيقه في فهم القدرة الخلوية والإمكانات التنموية.
نقاش
في مناقشة ورقة البحث، يقدم المؤلفون قدرات وآثار CytoTRACE 2، وهو إطار عمل جديد للتعلم العميق مصمم لتوقع القدرة الخلوية وحالات التمايز من بيانات تسلسل RNA للخلايا المفردة (scRNA-seq). يظهر الإطار أداءً متفوقًا في تحديد الإمكانات التنموية عبر أنواع الخلايا المختلفة، محققًا ارتباطًا عاليًا مع مستويات القدرة الحقيقية (τ = 0.86، P < 2.2 × 10^{-16}). يدمج CytoTRACE 2 بفعالية الشبكات الثنائية لمجموعات الجينات (GSBNs) لتعلم وتفسير مجموعات الجينات المرتبطة بفئات القدرة المختلفة، بما في ذلك القدرة الكاملة، والقدرة المتعددة، والقدرة المتعددة، والقدرة المحدودة، والقدرة الفردية، وحالات التمايز. من الجدير بالذكر أن توقعات النموذج مدعومة بالتحقق الواسع من خلال فحص CRISPR knockout على نطاق واسع، مما يكشف أن علامات القدرة الإيجابية تتزايد في الجينات التي تعزز التمايز، بينما تمنع العلامات السلبية ذلك. يسلط المؤلفون الضوء على قابلية تفسير الإطار، مما يسمح بتحديد العلامات الجزيئية الرئيسية، مثل تلك المشاركة في استقلاب الكوليسترول وتخليق الأحماض الدهنية غير المشبعة (مثل Fads1 وFads2 وScd2)، التي ترتبط باستمرار بالخلايا متعددة القدرات عبر أنسجة متنوعة. على الرغم من نقاط قوته، يعترف المؤلفون بالقيود، بما في ذلك الاعتماد على جودة بيانات التدريب والانخفاض المحتمل في الأداء في الخلايا ذات محتوى RNA المنخفض. يقترحون أن قابلية CytoTRACE 2 للتكيف مع أنواع مختلفة من خلال رسم الخرائط المتجانسة قد توسع من قابليته للتطبيق. بشكل عام، تضع الدراسة CytoTRACE 2 كأداة قيمة لتعزيز فهمنا لقدرة الخلايا ولتحديد العلامات الحيوية والأهداف العلاجية في علم الأحياء التنموي وسياقات الأمراض.
DOI: https://doi.org/10.1038/s41592-025-02857-2
PMID: https://pubmed.ncbi.nlm.nih.gov/41145665
Publication Date: 2025-10-27
Author(s): Minji Kang et al.
Primary Topic: Single-cell and spatial transcriptomics
Methods
In this section, the authors detail the methodologies employed to benchmark CytoTRACE 2 against various supervised machine learning approaches for cell type prediction and developmental potential inference. They evaluated CytoTRACE 2 alongside three specialized single-cell annotation methods (scPred, SingleCellNet, and scmap) and five general-purpose classifiers. The evaluation involved training and testing across four folds, including randomized splits of a single-cell potency atlas, with performance metrics assessed using mean multiclass F1 score and mean absolute error (MAE). Expression data were preprocessed into a uniform feature space, normalized using CPM/TPM followed by log2 transformation, and standardized to zero mean and unit variance, with alternative normalization methods yielding inferior results.
Additionally, the authors compared CytoTRACE 2 with eight existing methods for predicting developmental potential from single-cell RNA sequencing (scRNA-seq) data, utilizing nearly 19,000 annotated gene sets. The analysis was conducted without batch correction or dataset integration, and expression data were normalized according to each method’s recommendations. For experimental validation, the authors described the isolation of various hematopoietic stem and progenitor cells from C57BL/6 mice using flow cytometry, detailing the specific antibodies and protocols employed. This comprehensive methodology aims to rigorously assess the performance of CytoTRACE 2 and its applicability in understanding cellular potency and developmental potential.
Discussion
In the discussion of the research paper, the authors present the capabilities and implications of CytoTRACE 2, a novel deep learning framework designed to predict cellular potency and differentiation states from single-cell RNA sequencing (scRNA-seq) data. The framework demonstrates superior performance in identifying developmental potential across various cell types, achieving high correlation with ground truth potency levels (τ = 0.86, P < 2.2 × 10^{-16}). CytoTRACE 2 effectively integrates gene set binary networks (GSBNs) to learn and interpret gene sets associated with different potency categories, including totipotent, pluripotent, multipotent, oligopotent, unipotent, and differentiated states. Notably, the model's predictions are supported by extensive validation through a large-scale CRISPR knockout screen, revealing that positive multipotency markers are enriched for genes that promote differentiation, while negative markers inhibit it. The authors highlight the framework's interpretability, which allows for the identification of key molecular markers, such as those involved in cholesterol metabolism and unsaturated fatty acid synthesis (e.g., Fads1, Fads2, Scd2), that are consistently associated with multipotent cells across diverse tissues. Despite its strengths, the authors acknowledge limitations, including reliance on the quality of training data and potential performance declines in low RNA content cells. They suggest that CytoTRACE 2's adaptability to different species through ortholog mapping could broaden its applicability. Overall, the study positions CytoTRACE 2 as a valuable tool for advancing our understanding of cell potency and for identifying biomarkers and therapeutic targets in developmental biology and disease contexts.
