DOI: https://doi.org/10.1016/j.softx.2025.102098
تاريخ النشر: 2025-02-15
المؤلف: Zhenyun Du وآخرون
الموضوع الرئيسي: البحث في علم القياسات العلمية والبيبلومetrics
نظرة عامة
تتناول الورقة التحديات التي تواجه التحليلات البيبليومترية، بما في ذلك قضايا مثل السجلات المكررة، والبيانات الوصفية غير المكتملة، وصيغ البيانات غير المتسقة، والتي تعيق الموثوقية والكفاءة. لمعالجة هذه المشكلات، يقدم المؤلفون BibexPy، وهو حل برمجي قائم على بايثون يقوم بأتمتة دمج وتعزيز مجموعات البيانات البيبليومترية من مصادر مثل Scopus وWeb of Science. يستخدم BibexPy إزالة التكرار المعتمدة على DOI ويعزز البيانات الوصفية من خلال واجهات برمجة التطبيقات مثل Unpaywall وSemantic Scholar، مما يوفر في النهاية صيغ جاهزة للتحليل متوافقة مع أدوات مثل VosViewer وBiblioshiny. تقلل هذه الأتمتة بشكل كبير من العمل اليدوي مع تحسين جودة البيانات.
في الختام، يبسط BibexPy معالجة البيانات البيبليومترية، مما يسهل إنشاء مجموعات بيانات شاملة تعزز موثوقية ودقة البحث البيبليومتري. يقوم البرنامج بتحسين المهام الحرجة مثل إزالة التكرار وإكمال البيانات، مما يسمح للباحثين بإجراء التحليلات بشكل أكثر كفاءة. بينما يعمل حالياً بشكل كامل مع Web of Science وScopus، يستكشف BibexPy أيضًا دعم قواعد بيانات إضافية مثل PubMed وDimensions، مع خطط للتعزيزات المستقبلية. يمكن أن يؤدي التكامل المحتمل لتقنيات معالجة البيانات المتقدمة، وتعلم الآلة، وأدوات التصور التفاعلي إلى تحويل BibexPy إلى منصة شاملة لتحليل البيانات، مما يؤثر بشكل كبير على مجال البحث العلمي.
نقاش
تسلط قسم النقاش في ورقة البحث الضوء على الأهمية المتزايدة للتحليل البيبليومتري في البحث العلمي، مع التأكيد على الحاجة إلى دمج فعال للبيانات من قواعد بيانات الاقتباس المتعددة مثل Web of Science (WoS) وScopus. على الرغم من توفر أدوات برمجية متنوعة لرسم الخرائط البيبليومترية، إلا أن العديد منها يواجه صعوبات مع تعقيدات دمج البيانات، مما يؤدي إلى مشكلات مثل اختلافات الصيغ، والبيانات الوصفية المفقودة، والسجلات المكررة. غالبًا ما يتطلب ذلك تدخلًا يدويًا، مما قد يؤدي إلى عدم اتساق وأخطاء. تقدم الورقة BibexPy، وهو أداة سطر أوامر قائمة على بايثون مصممة لأتمتة معالجة البيانات البيبليومترية، مع معالجة هذه التحديات من خلال تسهيل دمج البيانات، وإزالة التكرار، وتعزيز البيانات الوصفية.
يستخدم BibexPy بنية معيارية تسمح بمعالجة فعالة لمجموعات البيانات البيبليومترية، مما يولد مخرجات متوافقة مع أدوات التحليل الشائعة مثل VOSviewer وBiblioshiny. تعزز عملية إزالة التكرار في البرنامج موثوقية مجموعة البيانات من خلال دمج المعلومات التكميلية من الإدخالات المكررة، بينما تملأ عملية تعزيز البيانات الوصفية المعتمدة على واجهة برمجة التطبيقات الحقول المفقودة، مما يضمن مجموعات بيانات شاملة للتحليل. توضح الورقة التحسينات الكبيرة في جودة البيانات التي تم تحقيقها من خلال BibexPy، مما يظهر إمكانيته في تبسيط سير العمل البيبليومتري وتعزيز موثوقية نتائج البحث. مع استمرار تطور BibexPy، يهدف إلى توسيع قدراته ودعم قواعد بيانات إضافية، مما يضعه كأداة حيوية للباحثين الذين يسعون لإجراء تحليلات بيبليومترية شاملة وفعالة.
DOI: https://doi.org/10.1016/j.softx.2025.102098
Publication Date: 2025-02-15
Author(s): Zhenyun Du et al.
Primary Topic: scientometrics and bibliometrics research
Overview
The paper discusses the challenges faced in bibliometric analyses, including issues like duplicate records, incomplete metadata, and inconsistent data formats, which hinder reliability and efficiency. To address these problems, the authors introduce BibexPy, a Python-based software solution that automates the integration and enrichment of bibliometric datasets from sources such as Scopus and Web of Science. BibexPy employs DOI-based deduplication and enhances metadata through APIs like Unpaywall and Semantic Scholar, ultimately providing analysis-ready formats compatible with tools like VosViewer and Biblioshiny. This automation significantly reduces manual labor while improving data quality.
In conclusion, BibexPy streamlines the preprocessing of bibliometric data, facilitating the creation of comprehensive datasets that enhance the reliability and accuracy of bibliometric research. The software optimizes critical tasks such as duplicate removal and data completion, allowing researchers to conduct analyses more efficiently. While currently fully operational with Web of Science and Scopus, BibexPy is also exploring support for additional databases like PubMed and Dimensions, with plans for future enhancements. The potential integration of advanced data processing techniques, machine learning, and interactive visualization tools could transform BibexPy into a comprehensive data analytics platform, significantly impacting the field of scientific research.
Discussion
The discussion section of the research paper highlights the growing importance of bibliometric analysis in scientific research, emphasizing the need for effective integration of data from multiple citation databases like Web of Science (WoS) and Scopus. Despite the availability of various software tools for bibliometric mapping, many struggle with the complexities of data integration, leading to issues such as format discrepancies, missing metadata, and duplicate records. This often necessitates manual intervention, which can introduce inconsistencies and errors. The paper introduces BibexPy, a Python-based command-line tool designed to automate the preprocessing of bibliometric data, addressing these challenges by facilitating data integration, deduplication, and metadata enrichment.
BibexPy employs a modular architecture that allows for efficient processing of bibliometric datasets, generating outputs compatible with popular analysis tools such as VOSviewer and Biblioshiny. The software’s deduplication process enhances dataset reliability by merging complementary information from duplicate entries, while its API-based metadata enrichment fills in missing fields, ensuring comprehensive datasets for analysis. The paper outlines the significant improvements in data quality achieved through BibexPy, demonstrating its potential to streamline bibliometric workflows and enhance the reliability of research findings. As BibexPy continues to evolve, it aims to expand its capabilities and support additional databases, positioning itself as a vital tool for researchers seeking to conduct thorough and efficient bibliometric analyses.
