DOI: https://doi.org/10.1093/nar/gkae410
PMID: https://pubmed.ncbi.nlm.nih.gov/38769056
تاريخ النشر: 2024-05-20
المؤلف: Linelle Ann L Abueg وآخرون
الموضوع الرئيسي: الحوسبة العلمية وإدارة البيانات
نظرة عامة
يسهل مشروع جالاكسي، المتاح عالميًا من خلال خدمات مجانية الاستخدام، البحث المدفوع من قبل المستخدمين من خلال توفير منصة مستقرة مع أدوات ومجموعات بيانات متنوعة، بالإضافة إلى التدريب والدعم لتحليل البيانات المعقدة. لقد حسنت التحسينات الأخيرة، التي تم توجيهها بواسطة مبادئ تصميم تجربة المستخدم (UXD)، من إمكانية الوصول واكتشاف الأدوات، لا سيما من خلال نطاقات جالاكسي لاب الفرعية ومخزن أدوات جالاكسي المعاد تصميمه. يتقدم المشروع في مجالين رئيسيين: دمج وحدات المعالجة الرسومية العامة (GPGPUs) للمنهجيات المتقدمة ودعم الأدوات المرخصة.
لتعزيز المشاركة مع اتحادات البحث العالمية، يقوم جالاكسي بتوسيع عروض سير العمل الخاصة به وتعزيز الخدمات العامة لاستيعابها. كما شهدت شبكة تدريب جالاكسي (GTN) أيضًا نموًا في كل من محفظتها وإمكانية الوصول، حيث تتميز بمسارات تعلم منظمة ودمج مباشر مع أدوات جالاكسي المستخدمة في دورات التدريب. يتماشى تطوير الشيفرة المستمر مع خريطة طريق مشروع جالاكسي، مع التركيز على تحسينات في جدولة الوظائف وواجهة المستخدم. بالإضافة إلى ذلك، يتم تنفيذ تقييمات الأثر البيئي لزيادة الوعي بين المستخدمين والمطورين حول الاستدامة، من خلال عرض تقديرات انبعاثات CO₂ لكل وظيفة جالاكسي.
مقدمة
تسلط مقدمة ورقة البحث الضوء على التقدم الكبير ومشاركة المستخدمين في مشروع جالاكسي، الذي يعمل منذ 19 عامًا. شهد المشروع زيادة كبيرة في الإنتاجية العالمية، مع أكثر من 500,000 مستخدم مسجل وأكثر من 1,000,000 وظيفة تم تنفيذها شهريًا في عام 2023. يوفر جالاكسي منصة متعددة الاستخدامات لتحليل البيانات، مما يسمح للباحثين بإنشاء سير عمل معقدة يمكنها التعامل مع جودة بيانات متغيرة وتسهيل البحث التعاوني عبر مجالات علمية متنوعة، بما في ذلك علم الجينوم، وعلم البروتينات، وعلم الفلك.
لقد حسنت التحسينات الأخيرة على واجهة جالاكسي من رؤية البيانات ومشاركة سير العمل، مع معالجة ملاحظات المستخدمين بشأن العدد الهائل من الأدوات المتاحة – أكثر من 9,500 حزمة برمجية متميزة. لتبسيط تجربة المستخدم، قدم جالاكسي نطاقات فرعية، مثل جالاكسي لاب، مصممة لمجالات بحث محددة، مما يسهل الوصول إلى الأدوات والموارد ذات الصلة. تتماشى هذه المبادرات مع الأهداف الاستراتيجية لمشروع جالاكسي لدعم اتحادات البحث العالمية والتعاون الإقليمي، مثل مشروع جينوم الفقاريات والشراكة الأوروبية لتقييم المخاطر الناتجة عن المواد الكيميائية، مما يعزز مكانة جالاكسي كمورد حيوي في البحث العلمي.
طرق
توضح هذه القسم الطرق التي استخدمتها شبكة تدريب جالاكسي (GTN) لتعزيز عروضها التعليمية استجابةً لممارسات البحث المتطورة. على مدار العام الماضي، قامت GTN بتحديث 366 درسًا، تمثل 90% من محتواها، وقدمت تسعة مواضيع جديدة، بما في ذلك تحليل الخلايا الفردية، SARS-CoV-2، الصحة الواحدة، التطور، علوم المواد، وعلم الأحياء الاصطناعي. من الجدير بالذكر أن المنهج الدراسي قد توسع ليشمل مواضيع أوسع مثل “تحليل البيانات FAIR”، الذي يوفر إرشادات عملية لتحسين إمكانية الوصول وقابلية استخدام البيانات وسير العمل.
بالإضافة إلى ذلك، تم دمج موضوع جديد “علوم البيانات”، يغطي مهارات البرمجة الأساسية في بايثون، R، SQL، وSnakemake من خلال دفاتر تفاعلية متوافقة مع جالاكسي. يظهر نمو مجتمع GTN من خلال إضافة أكثر من 70 مساهمًا جديدًا في العامين الماضيين، مما أدى إلى إجمالي 133 درسًا جديدًا منذ أبريل 2022. علاوة على ذلك، أسفرت التعاون مع AI4Life عن مواد تدريبية لمكتبة نماذج الصور الحيوية، والتي تستضاف على صفحات مخصصة ذات علامة تجارية لتسهيل الوصول القليل الصيانة للاتحادات العلمية، على الرغم من عدم ارتباطها المباشر بجالاكسي.
نقاش
يسلط قسم النقاش في ورقة البحث الضوء على التقدم والميزات لمشروع جالاكسي، مع التأكيد على دوره في تسهيل استخدام أدوات التحليل مفتوحة المصدر من طرف ثالث. يسمح مخزن أدوات جالاكسي للمطورين بإنشاء ومشاركة أغلفة جالاكسي لمختلف الأدوات، مما يعزز إمكانية وصول المستخدمين والتشغيل البيني. لقد حسنت التحديثات الأخيرة من دعم الأدوات المعتمدة على GPGPU، مثل AlphaFold2.0 وChatGPT، التي تزداد الطلب عليها. إن نشر موارد GPGPU، بما في ذلك التعديلات لتكوينات الأجهزة المختلفة، يمثل التزام جالاكسي بتلبية احتياجات المستخدمين. بالإضافة إلى ذلك، يعالج دمج الأدوات المرخصة الفجوات حيث لا تتوفر بدائل مفتوحة المصدر، مما يوسع مجموعة الأدوات المتاحة للمستخدمين.
يناقش القسم أيضًا أهمية اكتشاف الأدوات ومشاركة البيانات الوصفية، والتي تعتبر حاسمة للباحثين الذين يسعون للحصول على وظائف محددة. تلعب شبكة تدريب جالاكسي (GTN) دورًا كبيرًا في توفير موارد تدريبية متاحة، مع أكثر من 400 درس متاح. تشمل التحسينات الأخيرة على إطار عمل GTN محاضرات فيديو آلية، ومسارات تعلم، ودروس برمجة تفاعلية، جميعها تهدف إلى تحسين تجربة التعلم. علاوة على ذلك، تسهم تحسينات تجربة المستخدم، مثل نظام الإشعارات وميزات إدارة البيانات المحسنة، في واجهة أكثر سهولة. تعزز هيكل الحوكمة لمشروع جالاكسي المشاركة المجتمعية والشمولية، مما يضمن تطور المنصة استجابةً لملاحظات واحتياجات المستخدمين. بشكل عام، يواصل مشروع جالاكسي تعزيز قدراته، مما يعزز مجتمعًا عالميًا نابضًا من الباحثين والمطورين.
DOI: https://doi.org/10.1093/nar/gkae410
PMID: https://pubmed.ncbi.nlm.nih.gov/38769056
Publication Date: 2024-05-20
Author(s): Linelle Ann L Abueg et al.
Primary Topic: Scientific Computing and Data Management
Overview
The Galaxy Project, accessible globally through free-to-use services, facilitates user-driven research by providing a stable platform with diverse tools and datasets, alongside training and support for complex data analysis. Recent enhancements, guided by user experience design (UXD) principles, have improved accessibility and tool discoverability, particularly through the Galaxy Labs subdomains and a redesigned Galaxy ToolShed. The project is advancing in two key areas: the integration of general-purpose graphical processing units (GPGPUs) for advanced methodologies and the support of licensed tools.
To foster engagement with global research consortia, Galaxy is expanding its workflow offerings and enhancing public services to accommodate them. The Galaxy Training Network (GTN) has also seen growth in both its portfolio and accessibility, featuring structured learning paths and direct integration with Galaxy tools used in training courses. Ongoing code development aligns with the Galaxy Project roadmap, focusing on improvements in job scheduling and user interface. Additionally, environmental impact assessments are being implemented to raise awareness among users and developers about sustainability, by displaying estimated CO₂ emissions for each Galaxy job.
Introduction
The introduction of the research paper highlights the significant advancements and user engagement of the Galaxy Project, which has been operational for 19 years. The project has seen a substantial increase in global throughput, with over 500,000 registered users and more than 1,000,000 jobs executed monthly in 2023. Galaxy provides a versatile platform for data analytics, allowing researchers to create complex workflows that can handle variable data quality and facilitate collaborative research across various scientific domains, including genomics, proteomics, and astronomy.
Recent enhancements to the Galaxy interface have improved the visibility of data and workflow sharing, addressing user feedback regarding the overwhelming number of tools available—over 9,500 distinct software packages. To streamline user experience, Galaxy has introduced subdomains, such as Galaxy Labs, tailored to specific research areas, thereby simplifying access to relevant tools and resources. These initiatives align with the Galaxy Project’s strategic goals to support global research consortia and regional collaborations, such as the Vertebrate Genome Project and the European Partnership for the Assessment of Risks from Chemicals, further establishing Galaxy as a critical resource in scientific research.
Methods
The section outlines the methods employed by the Galaxy Training Network (GTN) to enhance its educational offerings in response to evolving research practices. Over the past year, GTN has updated 366 tutorials, representing 90% of its content, and introduced nine new topics, including Single Cell Analysis, SARS-CoV-2, One Health, Evolution, Materials Science, and Synthetic Biology. Notably, the curriculum has expanded to encompass broader themes such as ‘FAIR data analysis,’ which provides hands-on guidance for improving the accessibility and usability of data and workflows.
Additionally, a new ‘Data Science’ topic has been integrated, covering foundational programming skills in Python, R, SQL, and Snakemake through interactive notebooks compatible with Galaxy. The growth of the GTN community is evidenced by the addition of over 70 new contributors in the last two years, resulting in a total of 133 new tutorials since April 2022. Furthermore, a collaboration with AI4Life has yielded training materials for the BioimageModelZoo, which are hosted on custom-branded pages to facilitate minimal-maintenance access for scientific consortia, despite their lack of direct affiliation with Galaxy.
Discussion
The discussion section of the research paper highlights the advancements and features of the Galaxy Project, emphasizing its role in facilitating the use of third-party open-source analysis tools. The Galaxy Toolshed allows developers to create and share Galaxy wrappers for various tools, enhancing user accessibility and interoperability. Recent updates have improved support for GPGPU-based tools, such as AlphaFold2.0 and ChatGPT, which are increasingly in demand. The deployment of GPGPU resources, including adaptations for different hardware configurations, exemplifies Galaxy’s commitment to meeting user needs. Additionally, the integration of licensed tools addresses gaps where open-source alternatives are not available, thereby expanding the toolset accessible to users.
The section also discusses the importance of tool discoverability and metadata sharing, which are crucial for researchers seeking specific functionalities. The Galaxy Training Network (GTN) plays a significant role in providing accessible training resources, with over 400 tutorials available. Recent enhancements to the GTN framework include automated video lectures, learning pathways, and interactive coding tutorials, all aimed at improving the learning experience. Furthermore, user experience improvements, such as a notification system and enhanced data management features, contribute to a more intuitive interface. The Galaxy Project’s governance structure promotes community engagement and inclusivity, ensuring that the platform evolves in response to user feedback and needs. Overall, the Galaxy Project continues to advance its capabilities, fostering a vibrant global community of researchers and developers.
