برنامج الأطلس البيولوجي البشري (HuBMAP): بناء واستخدام الأطلس المرجعي البشري ثلاثي الأبعاد
Human BioMolecular Atlas Program (HuBMAP): 3D Human Reference Atlas construction and usage

المجلة: Nature Methods، المجلد: 22، العدد: 4
DOI: https://doi.org/10.1038/s41592-024-02563-5
PMID: https://pubmed.ncbi.nlm.nih.gov/40082611
تاريخ النشر: 2025-03-13
المؤلف: Katy Börner وآخرون
الموضوع الرئيسي: علم النسخ الجيني أحادي الخلية والمكاني

نظرة عامة

برنامج الأطلس البيولوجي البشري (HuBMAP) مكرس لإنشاء أطلس مرجعي ثلاثي الأبعاد شامل لجسم الإنسان البالغ السليم، مستفيدًا من خبرة أكثر من 20 اتحادًا. تركز هذه المبادرة على تطوير إطار إحداثيات مشترك (CCF) جنبًا إلى جنب مع الرسوم البيانية المعرفية والأدوات التي توضح الهيكل متعدد المقاييس لجسم الإنسان، بما في ذلك الأعضاء والأنسجة والخلايا والجينات وعلامات البيولوجيا. النسخة الحالية من الأطلس المرجعي البشري (v.2.0) تسجل 4,499 هيكلًا تشريحيًا فريدًا، و1,195 نوعًا من الخلايا، و2,089 علامة حيوية مستمدة من 33 جدول ASCT+B و65 كائن مرجعي ثلاثي الأبعاد، جميعها مترابطة من خلال الأنطولوجيات.

تستعرض الورقة منهجيات مختلفة لدمج بيانات تجريبية جديدة في الأطلس المرجعي البشري، بما في ذلك أدوات توضيح نوع الخلايا (مثل Azimuth)، لوحات الأجسام المضادة المعتمدة، والتسجيل المكاني لبيانات الأنسجة. كما تناقش قصص المستخدمين، والمصطلحات، وصيغ البيانات، والتحقق من الأنطولوجيا، وعمليات التحليل الموحدة، بالإضافة إلى تطوير واجهات المستخدم والمواد التعليمية. يوفر بوابة HuBMAP وبوابة البيانات الوصول إلى مجموعات البيانات التجريبية، والأدوات، وموارد التدريب، بينما توفر بوابة الأطلس المرجعي البشري وصولًا مفتوحًا إلى بيانات الأطلس والمواد ذات الصلة. يلعب CCF دورًا حاسمًا في تنسيق البيانات متعددة الأنماط، مما يسهل دمج مجموعات البيانات المتنوعة، وتوفير عمليات عمل كمية للتطور المستمر للأطلس، مما يعزز في النهاية فهمنا لتشريح الإنسان وتنوعاته في الصحة والمرض.

الطرق

تستعرض قسم الطرق بناء واستخدام الأطلس المرجعي البشري (HRA) من خلال مزيج من البيانات التي أنشأها الخبراء البشريون وبيانات الأنسجة التجريبية. يتم دمج بيانات تجريبية جديدة في HRA من خلال ثلاث تقنيات رئيسية: التسجيل المكاني ثلاثي الأبعاد، الاختبارات المعتمدة على التعليق (مثل تسلسل RNA أحادي الخلية)، والاختبارات المكانية (مثل CODEX، Cell DIVE، وImaging Mass Cytometry). تستخدم بوابة بيانات HuBMAP بنية ميكروسيرفيس لإدارة وتقديم البيانات، مما يمكّن من استيعاب مجموعات بيانات كبيرة مع ضمان أمان البيانات ومصدرها. اعتبارًا من 20 يناير 2024، تستضيف البوابة 2,332 مجموعة بيانات من 213 متبرعًا، بما في ذلك 360 مجموعة بيانات لتسلسل RNA أحادي الخلية و79 مجموعة بيانات مكانية متوافقة مع مشروع رسم الخرائط والتعليق على الأعضاء (OMAP).

يتضمن تسجيل عينات الأنسجة تعاونًا بين خبراء الموضوع ومنسق التسجيل، الذي يستخدم أداة معالجة الموقع لإثراء البيانات الوصفية بمعلومات المتبرع والنشر. يتم تبسيط العملية من خلال استخدام “ميلتوم”، وهو جهاز قابل للطباعة ثلاثية الأبعاد مصمم لتسجيل كتل الأنسجة بشكل قابل للتكرار. بالنسبة لتوضيح بيانات النسخ، يتم تنزيل مجموعات البيانات من عدة بوابات ومعالجتها باستخدام أدوات توضيح نوع الخلايا المختلفة، مما يؤدي إلى تلخيصات شاملة للخلايا وملفات بيانات وصفية. بالإضافة إلى ذلك، تخضع مجموعات بيانات التصوير المتعدد المعتمدة على الأجسام المضادة لتقسيم الخلايا وتوضيح النوع، باستخدام أدوات مثل DeepCellTypes وSTalign للتوافق المكاني لبيانات متعددة الأوميات. تسهل هذه الطريقة المنهجية دمج وتحليل البيانات البيولوجية المتنوعة، مما يعزز فهم بنية الأنسجة وتركيبها الخلوي.

النتائج

تستعرض قسم النتائج تطوير ووظائف مكون البنية التحتية والتفاعل (IEC) لمشروع HuBMAP، الذي يستخدم بنية ميكروسيرفيس هجينة مرنة لتسهيل العمليات المتعلقة بالبيانات من خلال بوابة بيانات HuBMAP. تشمل المكونات الرئيسية أدوات HIVE، التي تعزز واجهة المستخدم، والتصور، ودمج سير العمل، ومكونات رسم الخرائط HIVE، التي أنتجت مراجع Azimuth وبوابة HRA بالتعاون مع خبراء خارجيين. يعمل موقع اتحاد HuBMAP كمركز رئيسي للوصول إلى الموارد، والمنشورات، وفرص التدريب.

كما يتناول القسم سبع قصص مستخدمين تُعلم تطوير الأطلس المرجعي البشري (HRA)، مع تسليط الضوء على أدوار المبرمجين، والباحثين، والأطباء، وعلماء الأمراض. تؤكد هذه القصص على فائدة الأطلس في التنبؤ بتوزيعات أنواع الخلايا، ومقارنة الأنسجة السليمة والمريضة، وتصور توزيعات المسافات بين الخلايا. بالإضافة إلى ذلك، يهدف HRA إلى ضمان الاستدامة من خلال العمليات التعاونية وتنفيذ لوحات المعلومات لتتبع الاستخدام والتطور. تستخدم كل من بوابة بيانات HuBMAP وبوابة HRA الرسوم البيانية المعرفية لدمج وربط البيانات التجريبية مع الأنطولوجيات الموجودة، مما يدعم جهود تنسيق البيانات والتحليل المستمرة.

المناقشة

تستعرض قسم المناقشة من ورقة البحث تطوير ودمج بنية تحتية هجينة مرنة سحابية لمشاريع الأطلس المرجعي البشري (HRA) وHuBMAP. تسهل هذه البنية التكامل المنهجي لأكثر من 50 خوارزمية مفتوحة المصدر من أكثر من 30 فريقًا، مع معالجة التحديات المتعلقة باتفاق البيانات الوصفية وتوافق واجهات برمجة التطبيقات. تعاون فريق تطوير الإنتاج HIVE مع مؤلفي الخوارزميات لضمان تنفيذ موثوق وقابل للتوسع لخوارزميات تقسيم الأنسجة والتعليق. تشمل المكونات الرئيسية للبنية التحتية إدخال بيانات شبه آلي، وتحليل وتعليق آلي، وزيادة إمكانية العثور على بيانات HuBMAP والوصول إليها من خلال واجهات برمجة التطبيقات والحاويات المعيارية.

بالإضافة إلى ذلك، تشمل بيانات HRA مجموعة متنوعة من مجموعات البيانات التي أنشأها الخبراء البشريون والتجريبية، بما في ذلك الهياكل التشريحية، وأنواع الخلايا، وعلامات البيولوجيا، منظمة في أنطولوجيات شاملة. تتضمن النسخة السادسة من HRA تحديثات كبيرة، مثل رسم بياني للأنظمة للهياكل التشريحية، وجداول ASCT+B واسعة النطاق، ورسم خرائط مفصلة لأنواع الخلايا وعلامات البيولوجيا. تضمن عمليات إثراء البيانات مخرجات عالية الجودة، بينما تهدف الجهود المستمرة لتوسيع الأنطولوجيات الحالية إلى تحسين تمثيل المصطلحات التشريحية والخلوية الخاصة بالإنسان. تعزز نشر بيانات HRA كل ستة أشهر عبر بوابة HRA، جنبًا إلى جنب مع إنشاء واجهات وأدوات سهلة الاستخدام، إمكانية الوصول وسهولة الاستخدام للباحثين والأطباء على حد سواء.

Journal: Nature Methods, Volume: 22, Issue: 4
DOI: https://doi.org/10.1038/s41592-024-02563-5
PMID: https://pubmed.ncbi.nlm.nih.gov/40082611
Publication Date: 2025-03-13
Author(s): Katy Börner et al.
Primary Topic: Single-cell and spatial transcriptomics

Overview

The Human BioMolecular Atlas Program (HuBMAP) is dedicated to creating a comprehensive 3D Human Reference Atlas (HRA) of the healthy adult body, leveraging the expertise of over 20 consortia. This initiative focuses on developing a Common Coordinate Framework (CCF) alongside knowledge graphs and tools that elucidate the multiscale structure of the human body, encompassing organs, tissues, cells, genes, and biomarkers. The current version of the HRA (v.2.0) catalogs 4,499 unique anatomical structures, 1,195 cell types, and 2,089 biomarkers derived from 33 ASCT+B tables and 65 3D Reference Objects, all interconnected through ontologies.

The paper outlines various methodologies for integrating new experimental data into the HRA, including cell type annotation tools (e.g., Azimuth), validated antibody panels, and spatial registration of tissue data. It also discusses user stories, terminology, data formats, ontology validation, and unified analysis workflows, along with the development of user interfaces and instructional materials. The HuBMAP Portal and Data Portal provide access to experimental datasets, tools, and training resources, while the Human Reference Atlas Portal offers open access to atlas data and related materials. The CCF plays a crucial role in harmonizing multimodal data, facilitating the integration of diverse datasets, and providing quantitative workflows for the continuous evolution of the atlas, ultimately enhancing our understanding of human anatomy and its variations in health and disease.

Methods

The methods section outlines the construction and utilization of the Human Reference Atlas (HRA) through a combination of human-expert-generated data and experimental tissue data. The integration of new experimental data into the HRA is achieved via three primary techniques: 3D spatial registration, suspension-based assays (e.g., single-cell RNA sequencing), and spatial assays (e.g., CODEX, Cell DIVE, and Imaging Mass Cytometry). The HuBMAP Data Portal employs a microservices architecture to manage and serve data, enabling the ingestion of large datasets while ensuring data security and provenance. As of January 20, 2024, the portal hosts 2,332 datasets from 213 donors, including 360 single-cell RNA sequencing datasets and 79 spatial datasets aligned with the Organ Mapping and Annotation Project (OMAP).

The registration of tissue samples involves collaboration between subject-matter experts and a registration coordinator, who utilizes a location processor tool to enrich metadata with donor and publication information. The process is streamlined through the use of a ‘millitome,’ a 3D-printable device designed for reproducible tissue block registration. For transcriptomic data annotation, datasets are downloaded from multiple portals and processed using various cell type annotation tools, resulting in comprehensive cell summaries and metadata files. Additionally, antibody-based multiplexed imaging datasets undergo cell segmentation and type annotation, employing tools such as DeepCellTypes and STalign for spatial alignment of multi-omics data. This systematic approach facilitates the integration and analysis of diverse biological data, enhancing the understanding of tissue architecture and cellular composition.

Results

The results section outlines the development and functionalities of the HIVE Infrastructure and Engagement Component (IEC) for the HuBMAP project, which employs a flexible hybrid cloud microservices architecture to facilitate various data-related processes through the HuBMAP Data Portal. Key components include the HIVE Tools, which enhance user interface, visualization, and workflow integration, and the HIVE Mapping Components, which produced the Azimuth references and the HRA Portal in collaboration with external experts. The HuBMAP Consortium website serves as a central hub for accessing resources, publications, and internship opportunities.

The section also details seven user stories that inform the development of the Human Reference Atlas (HRA), highlighting the roles of programmers, researchers, clinicians, and pathologists. These stories emphasize the atlas’s utility in predicting cell-type populations, comparing healthy and diseased tissues, and visualizing cell distance distributions. Additionally, the HRA aims to ensure sustainability through collaborative processes and the implementation of dashboards to track usage and evolution. Both the HuBMAP Data Portal and the HRA Portal utilize knowledge graphs to integrate and link experimental data with existing ontologies, supporting ongoing data curation and analysis efforts.

Discussion

The discussion section of the research paper outlines the development and integration of a flexible hybrid cloud infrastructure for the Human Reference Atlas (HRA) and HuBMAP projects. This infrastructure facilitates the systematic integration of over 50 open-source algorithms from more than 30 teams, addressing challenges in metadata agreement and API compatibility. The HIVE production development team collaborated with algorithm authors to ensure reliable, scalable execution of tissue segmentation and annotation algorithms. Key components of the infrastructure include semi-automated data ingestion, automated analysis and annotation, and enhanced findability and accessibility of HuBMAP data through modular APIs and containers.

Additionally, the HRA data encompasses a variety of human-expert-generated and experimental datasets, including anatomical structures, cell types, and biomarkers, organized into comprehensive ontologies. The sixth release of the HRA includes significant updates, such as a systems graph for anatomical structures, extensive ASCT+B tables, and detailed mappings of cell types and biomarkers. Data enrichment processes ensure high-quality outputs, while ongoing efforts to extend existing ontologies aim to improve the representation of human-specific anatomical and cellular terms. The publication of HRA data every six months via the HRA Portal, along with the establishment of user-friendly interfaces and tools, enhances accessibility and usability for researchers and clinicians alike.