أرشيف و مستودع البيانات العصبية الكهرومغناطيسية: تحليل منصة مفتوحة المصدر
Neuroelectromagnetic Data Archive and Repository: Open-source platform analysis

المجلة: Aperture Neuro، المجلد: 6
DOI: https://doi.org/10.52294/001c.154162
تاريخ النشر: 2026-01-20
المؤلف: Tracy Brandmeyer وآخرون
الموضوع الرئيسي: دراسات الاتصال الوظيفي في الدماغ

نظرة عامة

تتناول الورقة الدور التحويلي للبنى التحتية للبيانات المفتوحة في علم الأعصاب، لا سيما من خلال أرشيف و مستودع البيانات الكهرومغناطيسية العصبية (NEMAR)، الذي يسهل مشاركة وإعادة استخدام مجموعات بيانات EEG و MEG و iEEG الموحدة بواسطة تنسيق هيكل بيانات تصوير الدماغ (BIDS). يكشف تدقيق منهجي لأكثر من 300 مجموعة بيانات متاحة للجمهور عن تقدم كبير في ممارسات مشاركة البيانات، خاصة في EEG، بينما يحدد أيضًا التحديات الحرجة مثل عدم اتساق البيانات الوصفية، والتمثيل الناقص للسكان السريريين، والامتثال المتغير لمعايير البيانات. تؤكد هذه النتائج على ضرورة وجود مبادرات سياسية وثقافية مستهدفة لتعزيز إمكانية الوصول، والعدالة، والصلابة العلمية للمستودعات المفتوحة مثل NEMAR.

في الختام، يمثل NEMAR إمكانيات علم الأعصاب المفتوح والتعاوني من خلال توفير إطار عمل قابل للتوسع وشفاف لمشاركة البيانات. على الرغم من التقدم المحرز، لا يزال الإمكان الكامل للبيانات الكهرومغناطيسية العصبية المشتركة مقيدًا. تؤكد الورقة على أن تحقيق فوائد العلوم المفتوحة سيتطلب ليس فقط بنية تحتية قوية ولكن أيضًا تحولًا ثقافيًا، وتحسين الأدوات، وحوافز للشفافية. يعتمد نجاح المبادرات مثل NEMAR على الجهود الجماعية من الباحثين والمؤسسات وهيئات التمويل لتعزيز بيئة مواتية لمشاركة البيانات الأخلاقية والمعيارية.

مقدمة

تؤكد مقدمة هذه الورقة البحثية على الدور المحوري للبيانات المفتوحة في علم الأعصاب، مشددة على إمكانياتها لتعزيز الشفافية، والتعاون، وإمكانية إعادة إنتاج النتائج العلمية. مع تقدير إنفاق حوالي 28 مليار دولار سنويًا على الأبحاث الطبية الحيوية غير القابلة للتكرار، فإن الحاجة إلى مشاركة البيانات الأخلاقية والقابلة للوصول إليها أمر حاسم. تهدف منصات البيانات المفتوحة، مثل أرشيف و مستودع بيانات التصوير العصبي والبيانات الكهربائية (NEMAR)، إلى معالجة هذه التحديات من خلال تسهيل إعادة استخدام بيانات التصوير العصبي، لا سيما بيانات الكهرومغناطيسية العصبية البشرية (NEM)، بما في ذلك تخطيط الدماغ الكهربائي (EEG) وتخطيط الدماغ المغناطيسي (MEG).

يعمل NEMAR بالتعاون مع OpenNeuro، الذي توسع ليشمل أنواعًا مختلفة من بيانات التصوير العصبي التي تتوافق مع معايير هيكل بيانات تصوير الدماغ (BIDS). يعزز دمج NEMAR مع OpenNeuro قدرات المنصة من خلال توفير ميزات متقدمة مثل مقاييس جودة البيانات الآلية، والتصورات المحسوبة مسبقًا، وأدوات لتوضيح الأحداث التجريبية. بالإضافة إلى ذلك، يتصل NEMAR ببوابة علم الأعصاب (NSG)، مما يسمح للباحثين باستخدام موارد الحوسبة عالية الأداء لتحليل البيانات على نطاق واسع دون الحاجة إلى تنزيل مجموعات البيانات. على الرغم من العدد المتزايد من مجموعات البيانات المتاحة، كان هناك تحليل محدود بشأن تكوينها والامتثال لمعايير مشاركة البيانات. تهدف هذه الدراسة إلى تقييم منهجي لمجموعات البيانات داخل NEMAR، مع تحديد نقاط القوة والثغرات في جودة البيانات الوصفية لتعزيز إدارة البيانات الفعالة والمستدامة في علم الأعصاب.

الطرق

في هذه الدراسة، تم إجراء تحليل شامل باستخدام مجموعة أولية من 306 مجموعات بيانات من قاعدة بيانات NEMAR، مع استخراج البيانات الوصفية من كل من قواعد بيانات NEMAR و OpenNeuro. تم استخراج المعلومات الرئيسية، بما في ذلك الخصائص السكانية للمشاركين، وخصائص مجموعة البيانات، والمواصفات الفنية، والمعلمات التجريبية، والبيانات المؤسسية، بشكل منهجي بواسطة فريق مكون من خمسة طلاب. تضمنت هذه العملية تسجيل يدوي في جدول بيانات مخصص، مع الحصول على تفاصيل إضافية من المنشورات ذات الصلة عند الضرورة. تم تصنيف مجموعات البيانات بناءً على نمط جمع البيانات (مثل: بصري، سمعي) ونوع التجارب (مثل: انتباه، ذاكرة)، مع توحيد المؤلفين للتصنيفات لتعزيز قابلية المقارنة.

بعد استخراج البيانات، تم تطبيق معايير الإدراج والاستبعاد، مما أدى إلى استبعاد 18 مجموعة بيانات لأسباب مثل عدم الامتثال لمعايير BIDS أو البيانات غير المكتملة. في النهاية، تم الاحتفاظ بـ 288 مجموعة بيانات، مع السماح بمزيد من التحسين لتحليل 292 إدخالًا متميزًا من خلال تقسيم مجموعات البيانات التي تحتوي على جلسات تجريبية غير ذات صلة. تم إجراء تحليل البيانات باستخدام نصوص بايثون، التي يمكن الوصول إليها علنًا، وتم توليد إحصائيات وصفية لاشتقاق مقاييس ذات صلة. بالإضافة إلى ذلك، تم جمع البيانات الوصفية من OpenNeuro عبر تجريف الويب لتقييم تكرار التقارير، مع توثيق جميع الإجراءات وتوافرها في مستودع GitHub المرتبط.

النتائج

يوفر قسم النتائج من الورقة البحثية نظرة شاملة على أرشيف و مستودع البيانات الكهرومغناطيسية العصبية (NEMAR)، مسلطًا الضوء على نموه، واستخدامه، وخصائص مجموعات البيانات التي يحتويها. نشأت الغالبية العظمى من الدراسات التي تساهم في NEMAR من الولايات المتحدة (42.8%)، مع مساهمات ملحوظة من المملكة المتحدة، وفرنسا، والعديد من الدول الأخرى. داخل الولايات المتحدة، كانت ولايات مثل ماريلاند، وكاليفورنيا، ونيو مكسيكو منتجة بشكل خاص. يكشف التحليل أن تخطيط الدماغ الكهربائي (EEG) هو النمط الأكثر استخدامًا، حيث يظهر في 75.34% من مجموعات البيانات، وغالبًا ما يكون مصحوبًا بالاختبارات السلوكية وأنماط أخرى مثل التصوير بالرنين المغناطيسي (MRI) وتخطيط الدماغ المغناطيسي (MEG). زاد عدد مجموعات بيانات EEG التي تم تحميلها بشكل كبير من 11 في عام 2019 إلى 62 في عام 2023، مما يشير إلى اتجاه متزايد في مشاركة البيانات مفتوحة المصدر.

يظهر التحليل الديموغرافي للمشاركين انحيازًا نحو الفئات العمرية الأصغر، حيث يزيد عمر أكثر من 60% عن 15 إلى 30 عامًا، وتمثيل ناقص ملحوظ للسكان السريريين، حيث تم اشتقاق 66.32% من مجموعات البيانات من مشاركين أصحاء. تظل شفافية البيانات الوصفية مصدر قلق، حيث تشير 52.1% فقط من مجموعات البيانات إلى مصادر التمويل و65.1% توثق الموافقات الأخلاقية. تؤكد الورقة على أهمية تحسين جودة البيانات الوصفية واكتمالها لتعزيز قابلية استخدام البيانات وإمكانية إعادة إنتاجها. بالإضافة إلى ذلك، تناقش الاستدامة البيئية لـ NEMAR، مشيرة إلى أنه على الرغم من أن له بصمة كربونية قابلة للقياس، فإن تسهيل المستودع لإعادة استخدام البيانات يقلل بشكل كبير من الأثر البيئي المرتبط بجمع البيانات المكررة. بشكل عام، تؤكد النتائج على دور NEMAR كمورد حيوي لأبحاث التصوير العصبي متعدد الأنماط مع تسليط الضوء على مجالات التحسين في تمثيل البيانات ومعايير البيانات الوصفية.

المناقشة

تؤكد المناقشة على الدور التحويلي للمنصات مثل NEMAR في تعزيز علم الأعصاب المفتوح والتعاوني من خلال بنى تحتية قابلة للتوسع وشفافة لمشاركة البيانات. يكشف التدقيق عن تقدم كبير في توفر البيانات الكهرومغناطيسية العصبية المشتركة؛ ومع ذلك، فإنه يحدد أيضًا التحديات المستمرة التي تعيق الإمكان الكامل لهذه الموارد.

للاستفادة الكاملة من البيانات المفتوحة، الموحدة، والمشاركة الأخلاقية للتطبيقات مثل التعلم الآلي، والتحليلات الميتا، والابتكارات السريرية، تؤكد الأبحاث على ضرورة وجود بنية تحتية قوية بالإضافة إلى تحول ثقافي داخل المجتمع العلمي. يتطلب هذا التحول تحسين الأدوات والحوافز التي تعزز الشفافية. بينما يوفر NEMAR أساسًا قويًا لهذه الجهود، فإن تحقيق إمكانات العلوم المفتوحة يعتمد على الالتزام الجماعي من الباحثين والمؤسسات وهيئات التمويل.

Journal: Aperture Neuro, Volume: 6
DOI: https://doi.org/10.52294/001c.154162
Publication Date: 2026-01-20
Author(s): Tracy Brandmeyer et al.
Primary Topic: Functional Brain Connectivity Studies

Overview

The paper examines the transformative role of open data infrastructures in neuroscience, particularly through the Neuroelectromagnetic Data Archive and Repository (NEMAR), which facilitates the sharing and reuse of EEG, MEG, and iEEG datasets standardized by the Brain Imaging Data Structure (BIDS) format. A systematic audit of over 300 publicly available datasets reveals significant advancements in data sharing practices, especially in EEG, while also identifying critical challenges such as inconsistent metadata, underrepresentation of clinical populations, and variable compliance with data standards. These findings underscore the necessity for targeted policy and cultural initiatives to enhance the accessibility, equity, and scientific robustness of open repositories like NEMAR.

In conclusion, NEMAR exemplifies the potential of open, collaborative neuroscience by providing a scalable and transparent framework for data sharing. Despite the progress made, the full potential of shared neuroelectromagnetic data remains constrained. The paper emphasizes that achieving the benefits of open science will require not only robust infrastructure but also a cultural shift, improved tools, and incentives for transparency. The success of initiatives like NEMAR hinges on collective efforts from researchers, institutions, and funding bodies to foster an environment conducive to ethical and standardized data sharing.

Introduction

The introduction of this research paper emphasizes the pivotal role of open data in neuroscience, highlighting its potential to enhance transparency, collaboration, and scientific reproducibility. With an estimated $28 billion spent annually on non-replicable biomedical research, the need for ethical and accessible data sharing is critical. Open data platforms, such as the Neuroimaging and Electrophysiology Metadata Archive and Repository (NEMAR), aim to address these challenges by facilitating the reusability of neuroimaging data, particularly human neuroelectromagnetic (NEM) data, including electroencephalography (EEG) and magnetoencephalography (MEG).

NEMAR operates in conjunction with OpenNeuro, which has expanded to accommodate various neuroimaging data types adhering to Brain Imaging Data Structure (BIDS) standards. The integration of NEMAR with OpenNeuro enhances the platform’s capabilities by providing advanced features such as automated data quality metrics, precomputed visualizations, and tools for annotating experimental events. Additionally, NEMAR connects to the Neuroscience Gateway (NSG), allowing researchers to utilize high-performance computing resources for large-scale data analysis without the need to download datasets. Despite the increasing number of datasets available, there has been limited analysis regarding their composition and adherence to data-sharing standards. This study aims to systematically evaluate the datasets within NEMAR, identifying strengths and gaps in metadata quality to promote effective and sustainable data governance in neuroscience.

Methods

In this study, a comprehensive analysis was conducted using an initial pool of 306 datasets from the NEMAR database, with metadata sourced from both NEMAR and OpenNeuro databases. Key information, including participant demographics, dataset characteristics, technical specifications, experimental parameters, and institutional data, was systematically extracted by a team of five students. This process involved manual logging into a dedicated spreadsheet, with additional details sourced from relevant publications when necessary. The datasets were categorized based on the modality of data collection (e.g., Visual, Auditory) and the type of experiments (e.g., Attention, Memory), with authors standardizing classifications to enhance comparability.

Following data extraction, inclusion and exclusion criteria were applied, resulting in the exclusion of 18 datasets due to reasons such as non-compliance with BIDS standards or incomplete data. Ultimately, 288 datasets were retained, with further refinement allowing for the analysis of 292 distinct entries by splitting datasets that contained unrelated experimental sessions. Data analysis was performed using Python scripts, which are publicly accessible, and descriptive statistics were generated to derive relevant metrics. Additionally, metadata from OpenNeuro was collected via web scraping to assess reporting frequency, with all procedures documented and available in the associated GitHub repository.

Results

The results section of the research paper provides a comprehensive overview of the Neuroelectromagnetic Data Archive and Repository (NEMAR), highlighting its growth, usage, and the characteristics of the datasets it houses. The majority of studies contributing to NEMAR originated from the United States (42.8%), with notable contributions from the United Kingdom, France, and several other countries. Within the U.S., states like Maryland, California, and New Mexico were particularly prolific. The analysis reveals that electroencephalography (EEG) is the most frequently utilized modality, appearing in 75.34% of datasets, often in conjunction with behavioral testing and other modalities such as MRI and magnetoencephalography (MEG). The number of EEG datasets uploaded has significantly increased from 11 in 2019 to 62 in 2023, indicating a growing trend in open-source data sharing.

Demographic analysis of participants shows a skew towards younger populations, with over 60% aged between 15 and 30 years, and a notable underrepresentation of clinical populations, as 66.32% of datasets were derived from healthy participants. Metadata transparency remains a concern, with only 52.1% of datasets indicating funding sources and 65.1% documenting ethical approvals. The paper emphasizes the importance of improving metadata quality and completeness to enhance data usability and reproducibility. Additionally, it discusses the environmental sustainability of NEMAR, noting that while it has a measurable carbon footprint, the repository’s facilitation of data reuse significantly mitigates the environmental impact associated with redundant data collection. Overall, the findings underscore NEMAR’s role as a vital resource for multimodal neuroimaging research while highlighting areas for improvement in data representation and metadata standards.

Discussion

The discussion emphasizes the transformative role of platforms like NEMAR in advancing open and collaborative neuroscience through scalable and transparent data-sharing infrastructures. The audit reveals significant progress in the availability of shared neuroelectromagnetic data; however, it also identifies persistent challenges that hinder the full potential of these resources.

To fully leverage open, standardized, and ethically shared data for applications such as machine learning, meta-analyses, and clinical innovations, the research underscores the necessity of not only robust infrastructure but also a cultural shift within the scientific community. This shift requires improved tools and incentives that promote transparency. While NEMAR provides a solid foundation for these efforts, the realization of open science’s potential hinges on collective commitment from researchers, institutions, and funding bodies.