DOI: https://doi.org/10.1007/s11192-025-05413-z
تاريخ النشر: 2025-09-01
المؤلف: Liangping Ding وآخرون
الموضوع الرئيسي: الحوسبة العلمية وإدارة البيانات
نظرة عامة
تقدم هذه القسم من ورقة البحث نظرة عامة على ظهور وتأثير الذكاء الاصطناعي التوليدي (GenAI) في البحث العلمي. باستخدام قاعدة بيانات OpenAlex البيبلومترية، أجرى المؤلفون تحليلًا تجريبيًا لمطبوعات GenAI وغيرها من المطبوعات المتعلقة بالذكاء الاصطناعي من 2017 إلى 2023. قاموا بتطوير مصنف من مرحلتين يعتمد على GPT-4 وSciBERT لتمييز بين المطبوعات التي تستخدم تقنيات الذكاء الاصطناعي بنشاط وتلك التي تناقشها فقط. يكشف التحليل عن نمو كبير في المطبوعات والتطبيقات المتعلقة بـ GenAI، مما يشير إلى تحول يتجاوز علوم الحاسوب إلى مجالات علمية متنوعة.
تسلط النتائج الضوء على أن الباحثين الأمريكيين يمثلون ما يقرب من 40% من المطبوعات العالمية المتعلقة بـ GenAI، مع مساهمة الباحثين الصينيين بحوالي 33%. بالإضافة إلى ذلك، تظهر العديد من الاقتصادات المتقدمة الصغيرة والمتوسطة اهتمامًا ملحوظًا بتطبيقات GenAI. كما تحدد الدراسة وجود علاقة إيجابية بين تطبيق GenAI وأحجام الفرق الأكبر (p < 0.001) بالإضافة إلى زيادة التعاون الدولي (p < 0.05). تشير هذه الاتجاهات إلى أن تطبيق GenAI في البحث يتطلب جهودًا تعاونية معززة، خاصة من خلال الشراكات الدولية، مما يعزز شبكات التعاون العالمية في إنتاج المعرفة.
مقدمة
تناقش مقدمة هذه الورقة البحثية الإمكانيات التحولية للذكاء الاصطناعي التوليدي (GenAI) في العلوم والتكنولوجيا، مع تسليط الضوء على تداعياته على الأخلاق، وإمكانية التكرار، والتوظيف، والإنتاجية، والإبداع. لقد أثار الارتفاع السريع لـ GenAI، خاصة من خلال أدوات مثل نماذج اللغة الكبيرة، اهتمامًا كبيرًا بين الباحثين، الذين يستكشفون تطبيقاته في العصف الذهني، واكتشاف الأدوية، وتصميم التجارب. ومع ذلك، فإن نشر GenAI يثير أيضًا تحديات أخلاقية وإبستيمية، خاصة فيما يتعلق بالطبيعة غير الشفافة للأنظمة الملكية والتداعيات على حقوق الملكية الفكرية في البحث العلمي.
تهدف الورقة إلى التمييز بين الأبحاث التي تطبق GenAI وتلك التي تناقش تداعياته فقط، وهو تمييز حاسم يُعلم فهم دمج GenAI في المنهجيات العلمية. يقترح المؤلفون التحقيق في ثلاثة أسئلة بحثية رئيسية: أنماط استخدام GenAI عبر التخصصات العلمية، وتأثيره على ديناميات التعاون وأحجام الفرق، وعلاقته بالتعاون الدولي في ظل التوترات الجيوسياسية. لمعالجة هذه الأسئلة، تستخدم الدراسة تحليلًا بيبلومتريًا باستخدام OpenAlex لتصنيف المطبوعات وتقييم خصائص GenAI مقارنة بتقنيات الذكاء الاصطناعي الأخرى. من المتوقع أن تسهم النتائج في تقديم رؤى قيمة حول الدور المتطور لـ GenAI في تشكيل الممارسات العلمية المعاصرة وإبلاغ المبادرات البحثية المستقبلية وسياسات العلوم.
الطرق
في هذه الدراسة، يفحص المؤلفون ظهور الذكاء الاصطناعي التوليدي (GenAI) ضمن الأدبيات العلمية من خلال استخدام مجموعة بيانات شاملة من المطبوعات المتعلقة بالذكاء الاصطناعي، والتي تُسمى “جميع مطبوعات الذكاء الاصطناعي.” تشمل هذه المجموعة كلاً من الأعمال المحددة لـ GenAI والأبحاث المتعلقة بالذكاء الاصطناعي بشكل أوسع. لتسهيل تحليل أكثر دقة، تم تقسيم مجموعة البيانات إلى فئتين متميزتين: مجموعة بيانات مطبوعات تطبيقات الذكاء الاصطناعي، التي تركز على التطبيقات العملية للذكاء الاصطناعي، ومجموعة بيانات مطبوعات مناقشة الذكاء الاصطناعي، التي تتناول المناقشات النظرية والمفاهيمية المحيطة بالذكاء الاصطناعي. يتم توضيح تفاصيل منهجية إضافية في الأقسام التالية من الورقة.
النتائج
تكشف نتائج تحليل الانحدار عن وجود علاقة كبيرة بين استخدام الذكاء الاصطناعي التوليدي (GenAI) ومقاييس التعاون، خاصة حجم الفريق والتعاون الدولي. شمل التحليل إزالة القيم الشاذة بناءً على عتبة النسبة المئوية 99، مما أدى إلى استبعاد 7,237 قيمة شاذة من مجموعة بيانات جميع مطبوعات الذكاء الاصطناعي، والتي تضمنت 139 مطبوعة لـ GenAI. تشير النتائج إلى أن الأوراق المتعلقة بـ GenAI تحتوي على متوسط 4.04 تأثيرات، مع نتائج قوية عبر طرق تقدير متنوعة، بما في ذلك المربعات الصغرى العادية (OLS) وتقديرات السالب الثنائي.
على وجه التحديد، بالنسبة لمطبوعات تطبيقات الذكاء الاصطناعي، فإن التأثير الهامشي لـ GenAI على حجم الفريق (TS) إيجابي وذو دلالة، حيث ترتبط تطبيقات GenAI بفرق أكبر (متوسط TS 4.57) مقارنة بتطبيقات الذكاء الاصطناعي الأخرى (متوسط TS 4.25، $p < .001$). يشير هذا إلى أن حداثة GenAI قد تتطلب خبرة إضافية، مما يؤدي إلى فرق بحث أكبر. علاوة على ذلك، تظهر تطبيقات GenAI علاقة إيجابية مع عدد الدول المتعاونة، مما يشير إلى زيادة التعاون الدولي (1.31 دولة لـ GenAI مقابل 1.30 للذكاء الاصطناعي الآخر، $p < .001$). ومع ذلك، تظل الفروق العامة في حجم الفريق والتعاون الدولي متواضعة، مما يبرز الحاجة إلى مزيد من التحقيق في العوامل الأساسية التي تؤثر على هذه الاتجاهات، مثل دوافع البحث وإمكانية الوصول إلى أدوات GenAI.
المناقشة
في هذا القسم، يوضح المؤلفون منهجيتهم لجمع وتحليل البيانات البيبلومترية حول الذكاء الاصطناعي التوليدي (GenAI) ومطبوعات الذكاء الاصطناعي الأخرى (Other-AI) من قاعدة بيانات OpenAlex. قاموا بإنشاء مجموعة بيانات شاملة من خلال استخدام استراتيجية بحث قائمة على الكلمات الرئيسية من خطوتين، والتي تضمنت تحسين مصطلحات البحث لالتقاط الأوراق المتعلقة بـ GenAI بدقة مع تقليل الضوضاء من المطبوعات غير ذات الصلة. تركز الدراسة على المطبوعات من 2017 إلى 2023، متزامنة مع ظهور نموذج المحول، وهو تطور محوري في الذكاء الاصطناعي. يؤكد المؤلفون على أهمية الدقة على الاسترجاع في استراتيجية بحثهم، حيث حققوا معدل دقة مرتفع قدره 97.3% للمطبوعات المتعلقة بالذكاء الاصطناعي.
يكشف التحليل عن اتجاهات كبيرة في انتشار GenAI عبر مختلف التخصصات العلمية، مما يشير إلى تطوره من تركيز على علوم الحاسوب إلى تطبيقات أوسع في مجالات مثل الطب، وعلم الاجتماع، والكيمياء. تشير النتائج إلى أن GenAI أصبح تقنية عامة، تعزز المنهجيات البحثية وتتناول التحديات المعقدة عبر التخصصات. ومن الجدير بالذكر أن الولايات المتحدة قد برزت كقائد في إنتاج أبحاث GenAI، متفوقة على الصين، التي، على الرغم من حجمها الكبير من مطبوعات Other-AI، كانت أبطأ في اعتماد مفاهيم GenAI. يبرز المؤلفون تداعيات هذه الاتجاهات لفهم المشهد العالمي لأبحاث الذكاء الاصطناعي والسياقات المؤسسية والثقافية المتنوعة التي تشكل اعتماد وتطبيق تقنيات GenAI.
DOI: https://doi.org/10.1007/s11192-025-05413-z
Publication Date: 2025-09-01
Author(s): Liangping Ding et al.
Primary Topic: Scientific Computing and Data Management
Overview
This section of the research paper provides an overview of the emergence and impact of Generative Artificial Intelligence (GenAI) in scientific research. Utilizing the OpenAlex bibliometric database, the authors conducted an empirical analysis of GenAI and other AI-related publications from 2017 to 2023. They developed a two-stage classifier based on GPT-4 and SciBERT to differentiate between publications that actively employ AI technologies and those that merely discuss them. The analysis reveals significant growth in GenAI-related publications and applications, indicating a shift beyond computer science into various scientific disciplines.
The findings highlight that U.S. researchers account for nearly 40% of global GenAI publications, with Chinese researchers contributing approximately 33%. Additionally, several small and medium-sized advanced economies show notable engagement with GenAI applications. The study also identifies a positive correlation between GenAI application and larger team sizes (p < 0.001) as well as increased international collaboration (p < 0.05). This trend suggests that the application of GenAI in research necessitates enhanced collaborative efforts, particularly through international partnerships, thereby strengthening global collaboration networks in knowledge production.
Introduction
The introduction of this research paper discusses the transformative potential of Generative Artificial Intelligence (GenAI) in science and technology, highlighting its implications for ethics, reproducibility, employment, productivity, and creativity. The rapid rise of GenAI, particularly through tools like large language models, has garnered significant interest among researchers, who are exploring its applications in brainstorming, drug discovery, and experimental design. However, the deployment of GenAI also raises ethical and epistemic challenges, particularly concerning the non-transparent nature of proprietary systems and the implications for intellectual property rights in scientific research.
The paper aims to distinguish between research that applies GenAI and that which merely discusses its implications, a critical distinction that informs the understanding of GenAI’s integration into scientific methodologies. The authors propose to investigate three key research questions: the usage patterns of GenAI across scientific disciplines, its impact on collaboration dynamics and team sizes, and its relationship with international collaboration amidst geopolitical tensions. To address these questions, the study employs a bibliometric analysis using OpenAlex to categorize publications and assess the characteristics of GenAI in comparison to other AI technologies. The findings are expected to contribute valuable insights into the evolving role of GenAI in shaping contemporary scientific practices and inform future research initiatives and science policy.
Methods
In this study, the authors examine the emergence of Generative AI (GenAI) within the scientific literature by utilizing a comprehensive dataset of AI-related publications, termed “All AI Publications.” This dataset encompasses both GenAI-specific works and broader AI-related research. To facilitate a more nuanced analysis, the dataset is subdivided into two distinct categories: the AI Application Publications sub-dataset, which focuses on practical applications of AI, and the AI Discussion Publications sub-dataset, which addresses theoretical and conceptual discussions surrounding AI. Additional methodological details are elaborated in subsequent sections of the paper.
Results
The results of the regression analysis reveal a significant correlation between the use of Generative AI (GenAI) and collaboration metrics, particularly team size and international collaboration. The analysis involved the removal of outliers based on a 99th percentile threshold, resulting in the exclusion of 7,237 outliers from the All AI Publications dataset, which included 139 GenAI publications. The findings indicate that GenAI-related papers have an average of 4.04 effects, with robust results across various estimation methods, including ordinary least squares (OLS) and negative binomial estimates.
Specifically, for AI Application Publications, the marginal effect of GenAI on team size (TS) is positive and significant, with GenAI applications associated with larger teams (mean TS of 4.57) compared to Other-AI applications (mean TS of 4.25, $p < .001$). This suggests that the novelty of GenAI may necessitate additional expertise, leading to larger research teams. Furthermore, GenAI applications show a positive relationship with the number of collaborating countries, indicating greater international collaboration (1.31 countries for GenAI vs. 1.30 for Other-AI, $p < .001$). However, the overall differences in team size and international collaboration remain modest, highlighting the need for further investigation into the underlying factors influencing these trends, such as research motivations and the accessibility of GenAI tools.
Discussion
In this section, the authors detail their methodology for collecting and analyzing bibliometric data on generative AI (GenAI) and other artificial intelligence (Other-AI) publications from the OpenAlex database. They constructed a comprehensive dataset by employing a two-step keyword-based search strategy, which involved refining search terms to accurately capture GenAI-related papers while minimizing noise from unrelated publications. The study focuses on publications from 2017 to 2023, coinciding with the emergence of the Transformer model, a pivotal development in AI. The authors emphasize the importance of precision over recall in their search strategy, achieving a high precision rate of 97.3% for AI-related publications.
The analysis reveals significant trends in the diffusion of GenAI across various scientific disciplines, indicating its evolution from a computer science-centric focus to broader applications in fields such as medicine, sociology, and chemistry. The findings suggest that GenAI is becoming a general-purpose technology, enhancing research methodologies and addressing complex challenges across disciplines. Notably, the United States has emerged as a leader in GenAI research output, outpacing China, which, despite its high volume of Other-AI publications, has been slower to adopt GenAI concepts. The authors highlight the implications of these trends for understanding the global landscape of AI research and the varying institutional and cultural contexts that shape the adoption and application of GenAI technologies.
