تقييم المساءلة والشفافية والتحيز في اتخاذ قرارات الرعاية الصحية المدعومة بالذكاء الاصطناعي: دراسة نوعية لوجهات نظر المهنيين الصحيين في المملكة المتحدة
Evaluating accountability, transparency, and bias in AI-assisted healthcare decision- making: a qualitative study of healthcare professionals’ perspectives in the UK

المجلة: BMC Medical Ethics، المجلد: 26، العدد: 1
DOI: https://doi.org/10.1186/s12910-025-01243-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40629303
تاريخ النشر: 2025-07-08
المؤلف: Saoudi Ce Nouis وآخرون
الموضوع الرئيسي: الذكاء الاصطناعي في الرعاية الصحية والتعليم

نظرة عامة

تبحث هذه الورقة البحثية في الآثار الأخلاقية للذكاء الاصطناعي (AI) في اتخاذ القرارات الصحية، لا سيما داخل مؤسسة NHS واحدة في ويست ميدلاندز، المملكة المتحدة. من خلال مقابلات نوعية مع 40 من المتخصصين في الرعاية الصحية، بما في ذلك الأطباء ومطوري الذكاء الاصطناعي، تحدد الدراسة الموضوعات الرئيسية المحيطة بفوائد وتحديات دمج الذكاء الاصطناعي في البيئات السريرية. اعترف المشاركون بإمكانية الذكاء الاصطناعي لتعزيز كفاءة التشخيص وتخصيص الموارد، ومع ذلك، أعربوا عن مخاوف كبيرة بشأن المساءلة والشفافية والتحيز. شعر الأطباء بمسؤولية مزدوجة تجاه نتائج المرضى أثناء الاعتماد على رؤى الذكاء الاصطناعي، مما أثار تساؤلات حول المسؤولية في حالات فشل النظام. أعاقت الطبيعة الغامضة لنماذج “الصندوق الأسود” الثقة، لا سيما في الحالات المعقدة، وتم الإشارة إلى التحيزات في الخوارزميات كعوامل ضارة لمجموعات المرضى الأقلية.

تؤكد النتائج على ضرورة وجود أطر واضحة للمساءلة، ونماذج ذكاء اصطناعي شفافة، ومجموعات بيانات تدريب متنوعة لتخفيف المخاطر الأخلاقية. مع تطور تكنولوجيا الذكاء الاصطناعي، تدعو الدراسة إلى جهود تعاونية بين الأطباء والإداريين والمطورين وصانعي السياسات لوضع إرشادات تعالج هذه التحديات الأخلاقية. من خلال إعطاء الأولوية للمساءلة والشفافية وتقليل التحيز، يمكن لأنظمة الرعاية الصحية الاستفادة من قدرات الذكاء الاصطناعي مع ضمان سلامة المرضى والحفاظ على الثقة في الممارسات السريرية.

مقدمة

تسلط مقدمة هذه الورقة البحثية الضوء على التكامل الكبير لأنظمة السجلات الصحية الإلكترونية (EHR) في الرعاية الصحية، حيث تتجاوز معدلات الاعتماد 90% في العديد من البلدان، بما في ذلك 96% في الولايات المتحدة. أدى هذا الاستخدام الواسع إلى كميات هائلة من بيانات الرعاية الصحية المنظمة وغير المنظمة، التي يستفيد منها الذكاء الاصطناعي (AI) بشكل متزايد لتعزيز اتخاذ القرارات السريرية وتبسيط سير العمل. أظهرت تقنيات الذكاء الاصطناعي، بما في ذلك التعلم الآلي والتعلم العميق، وعدًا في تطبيقات متنوعة، مثل تشخيص اعتلال الشبكية السكري، وتحديد الانقسام الخلوي في سرطان الثدي، والتنبؤ بمخاطر القلب والأوعية الدموية. تهدف هذه التقدمات ليس فقط إلى تحسين نتائج المرضى ولكن أيضًا إلى تقديم فوائد اقتصادية محتملة من خلال تقليل عدم الكفاءة وتحسين استخدام الموارد في أنظمة الرعاية الصحية.

على الرغم من مزايا الذكاء الاصطناعي، تؤكد الورقة على القضايا الأخلاقية الحرجة التي لا تزال غير مستكشفة بشكل كاف، لا سيما فيما يتعلق بالمساءلة والشفافية والتحيز في اتخاذ القرارات المدعومة بالذكاء الاصطناعي. تعقد الطبيعة “الصندوق الأسود” للخوارزميات المتقدمة من نسب المسؤولية عندما تكون نتائج الرعاية الصحية دون المستوى، مما يثير تساؤلات حول أدوار المطورين والمؤسسات والأطباء. علاوة على ذلك، يمكن أن تؤدي التحيزات في نماذج الذكاء الاصطناعي إلى تفاقم الفجوات الصحية، مما يستلزم فهمًا أعمق لكيفية تجربة المتخصصين في الرعاية الصحية والتنقل عبر هذه التحديات الأخلاقية في الممارسة العملية. تهدف الدراسة إلى سد هذه الفجوة من خلال البحث النوعي، مع التركيز على التجارب الحياتية للأطباء أثناء دمج الذكاء الاصطناعي في رعاية المرضى. من خلال التقاط هذه الرؤى، تسعى الأبحاث إلى إبلاغ الإرشادات التنظيمية وبرامج التدريب التي تتماشى مع معايير الأخلاق والواقع السريري، مما يعزز في النهاية النتائج المتمحورة حول المريض في الرعاية الصحية.

الطرق

تحدد قسم “الطرق” في الورقة البحثية التصميم التجريبي والتقنيات التحليلية المستخدمة للتحقيق في أسئلة البحث. يوضح معايير اختيار المشاركين، والمواد المستخدمة، والإجراءات المتبعة أثناء جمع البيانات. استخدمت الدراسة مزيجًا من الطرق الكمية والنوعية، بما في ذلك التحليلات الإحصائية لتقييم أهمية النتائج.

بالإضافة إلى ذلك، يصف القسم النماذج الرياضية المحددة والمعادلات المطبقة لتفسير البيانات، مما يضمن نهجًا صارمًا للتحقق من النتائج. كما تم تسليط الضوء على الاعتبارات الأخلاقية، مثل الموافقة المستنيرة وتدابير السرية، لضمان الامتثال لمعايير البحث. بشكل عام، توفر الطرق المستخدمة إطارًا قويًا لفهم آثار نتائج الدراسة.

النتائج

تشير النتائج إلى أن المشاركين اعترفوا بإمكانية الذكاء الاصطناعي (AI) لتعزيز سير العمل التشخيصي والنتائج السريرية داخل بيئتهم المحلية في NHS. ومع ذلك، أكدوا أن التنفيذ الأخلاقي والعملي للذكاء الاصطناعي يعتمد على ثلاثة عوامل حاسمة: المساءلة، والشفافية، وتخفيف التحيز. يجب على الأطباء الحفاظ على المسؤولية النهائية عن رعاية المرضى، بينما يتولى المطورون والمؤسسات مسؤولية إنشاء حلول ذكاء اصطناعي آمنة وداعمة. علاوة على ذلك، فإن الشفافية أمر حاسم لتمكين الأطباء من تقييم نتائج الذكاء الاصطناعي بشكل نقدي بدلاً من قبولها دون قيد أو شرط.

تسلط المخاوف المتعلقة بالتحيز، لا سيما تلك التي تؤثر على المجموعات الأقلية والحالات النادرة، الضوء على ضرورة وجود مجموعات بيانات تدريب متنوعة ومراجعات مستمرة لأنظمة الذكاء الاصطناعي. على الرغم من أن هذه النتائج تستند إلى تجارب من مؤسسة NHS واحدة ولا ينبغي تعميمها، إلا أنها توفر أساسًا للجهود التعاونية التي تهدف إلى تعزيز نهج مسؤول ومتمحور حول المريض تجاه الذكاء الاصطناعي في الرعاية الصحية.

المناقشة

تسلط قسم المناقشة في هذه الدراسة الضوء على وجهات النظر الدقيقة للمتخصصين في الرعاية الصحية بشأن دمج أدوات الذكاء الاصطناعي في اتخاذ القرارات السريرية، مع التأكيد على موضوعات المساءلة والشفافية والتحيز. شملت الأبحاث النوعية، التي أجريت داخل مؤسسة NHS واحدة في ويست ميدلاندز، 40 مشاركًا من أدوار سريرية متنوعة، وتطوير الذكاء الاصطناعي، والإدارة. تشير النتائج إلى أنه بينما يمكن أن يعزز الذكاء الاصطناعي دقة التشخيص ويسهل سير العمل، لا تزال هناك مخاوف أخلاقية كبيرة قائمة. اتفق المشاركون إلى حد كبير على أنه يجب على الأطباء الاحتفاظ بالمسؤولية النهائية عن نتائج المرضى، لكن كان هناك جدل حول مدى المساءلة المشتركة مع مطوري الذكاء الاصطناعي والمنظمات الصحية. يعكس هذا توترًا أوسع في أخلاقيات الذكاء الاصطناعي بشأن المسؤولية وآثار أنظمة “الصندوق الأسود” الغامضة.

ظهرت الشفافية كقضية حاسمة، حيث أعرب المشاركون عن الحاجة إلى أن توفر أنظمة الذكاء الاصطناعي تبريرات واضحة لتوصياتها، لا سيما في السيناريوهات عالية المخاطر. أفاد العديد من الأطباء بصعوبات في الثقة في نتائج الذكاء الاصطناعي بسبب نقص القابلية للتفسير، مما يعقد قدرتهم على تبرير القرارات للمرضى. بالإضافة إلى ذلك، تم تحديد التحيز في خوارزميات الذكاء الاصطناعي كخطر كبير، لا سيما بالنسبة لمجموعات المرضى الممثلة تمثيلًا ناقصًا. أشار المشاركون إلى أن بيانات التدريب غير المتنوعة بشكل كافٍ يمكن أن تؤدي إلى نتائج مضللة، مما قد يؤدي إلى تفاقم الفجوات الموجودة في الرعاية الصحية. تؤكد الدراسة على أهمية المراقبة المستمرة والتدقيق في أنظمة الذكاء الاصطناعي لضمان تقديم رعاية صحية عادلة، مشيرة إلى أن الاستراتيجيات الاستباقية ضرورية لمعالجة هذه التحديات الأخلاقية بشكل فعال. بشكل عام، تسهم النتائج في المناقشات المستمرة حول الدمج المسؤول للذكاء الاصطناعي في الممارسة السريرية، لا سيما في السياق الفريد لـ NHS.

القيود

تقدم الدراسة عدة قيود تؤثر على شمولية وملاءمة نتائجها. أحد القيود الكبيرة هو استبعاد المشاركين من المرضى للحفاظ على السرية، مما يحد من فهم كيفية تأثير الرعاية المدعومة بالذكاء الاصطناعي على رضا المرضى واستقلاليتهم وثقتهم. على الرغم من أن المشاركين تخيلوا مواقف المرضى تجاه الذكاء الاصطناعي، إلا أن هذه الآراء لم يتم التحقق منها تجريبيًا. يجب أن تعطي الأبحاث المستقبلية الأولوية لمشاركة المرضى المباشرة من خلال المقابلات أو الاستطلاعات لتقييم وجهات نظرهم بشأن المساءلة والشفافية والتحيزات في أنظمة الذكاء الاصطناعي، مما يساهم في إبلاغ إرشادات السياسات التي تتماشى مع توقعات الجمهور.

بالإضافة إلى ذلك، يشير تركيز الدراسة على مزيج متنوع من تطبيقات الذكاء الاصطناعي – بشكل أساسي أدوات التشخيص والأدوات التشغيلية – إلى أن تصورات الشفافية والتحيز قد تختلف حسب نوع التطبيق، مما قد يحد من تعميم النتائج. تثير نسبة المشاركة البالغة 69% بين الموظفين المدعوين مخاوف بشأن تحيز الاختيار الذاتي، حيث قد يكون أولئك الذين لديهم آراء قوية حول الذكاء الاصطناعي أكثر احتمالًا للمشاركة، مما يؤثر على التمثيل. علاوة على ذلك، قد تكون الديناميات داخل مجموعات التركيز، لا سيما وجود الموظفين المبتدئين وكبار الموظفين، قد قيدت الآراء المخالفة. كما أن الطبيعة أحادية الموقع للدراسة تقيد أيضًا تعميم النتائج، مما يبرز الحاجة إلى أبحاث عبر مؤسسات متعددة. أخيرًا، لا يسمح التصميم النوعي، رغم غناه بالتفاصيل، بتحديد آثار الذكاء الاصطناعي الأوسع، كما أنه لا يعالج بشكل كافٍ تدريب الأطباء على أنظمة الذكاء الاصطناعي، مما يشير إلى مجالات لمزيد من التحقيق.

Journal: BMC Medical Ethics, Volume: 26, Issue: 1
DOI: https://doi.org/10.1186/s12910-025-01243-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40629303
Publication Date: 2025-07-08
Author(s): Saoudi Ce Nouis et al.
Primary Topic: Artificial Intelligence in Healthcare and Education

Overview

This research paper investigates the ethical implications of artificial intelligence (AI) in healthcare decision-making, particularly within a single NHS Trust in the West Midlands, UK. Through qualitative interviews with 40 healthcare professionals, including clinicians and AI developers, the study identifies key themes surrounding the benefits and challenges of AI integration in clinical settings. Participants acknowledged AI’s potential to enhance diagnostic efficiency and resource allocation, yet expressed significant concerns regarding accountability, transparency, and bias. Clinicians felt a dual responsibility for patient outcomes while relying on AI insights, raising questions about liability in cases of system failure. The opaque nature of “black box” models hindered trust, particularly in complex cases, and biases in algorithms were noted as detrimental to minority patient groups.

The findings emphasize the necessity for clear accountability frameworks, transparent AI models, and diverse training datasets to mitigate ethical risks. As AI technology evolves, the study advocates for collaborative efforts among clinicians, administrators, developers, and policymakers to establish guidelines that address these ethical challenges. By prioritizing accountability, transparency, and bias reduction, healthcare systems can leverage AI’s capabilities while ensuring patient safety and maintaining trust in clinical practices.

Introduction

The introduction of this research paper highlights the significant integration of electronic health record (EHR) systems in healthcare, with adoption rates exceeding 90% in many countries, including 96% in the United States. This widespread use has resulted in vast amounts of structured and unstructured healthcare data, which artificial intelligence (AI) is increasingly leveraging to enhance clinical decision-making and streamline workflows. AI technologies, including machine learning and deep learning, have shown promise in various applications, such as diagnosing diabetic retinopathy, identifying mitosis in breast cancer, and predicting cardiovascular risks. These advancements not only aim to improve patient outcomes but also offer potential economic benefits by reducing inefficiencies and optimizing resource use in healthcare systems.

Despite the advantages of AI, the paper underscores critical ethical concerns that remain underexplored, particularly regarding accountability, transparency, and bias in AI-assisted decision-making. The “black box” nature of advanced algorithms complicates the attribution of responsibility when healthcare outcomes are suboptimal, raising questions about the roles of developers, institutions, and clinicians. Furthermore, biases in AI models can exacerbate health disparities, necessitating a deeper understanding of how healthcare professionals experience and navigate these ethical challenges in practice. The study aims to fill this gap through qualitative research, focusing on the lived experiences of clinicians as they incorporate AI into patient care. By capturing these insights, the research seeks to inform regulatory guidelines and training programs that align AI integration with ethical standards and clinical realities, ultimately promoting patient-centered outcomes in healthcare.

Methods

The “Methods” section of the research paper outlines the experimental design and analytical techniques employed to investigate the research questions. It details the selection criteria for participants, the materials used, and the procedures followed during data collection. The study utilized a combination of quantitative and qualitative methods, including statistical analyses to assess the significance of the findings.

Additionally, the section describes the specific mathematical models and equations applied to interpret the data, ensuring a rigorous approach to validating the results. Ethical considerations, such as informed consent and confidentiality measures, are also highlighted to ensure compliance with research standards. Overall, the methods employed provide a robust framework for understanding the implications of the study’s findings.

Results

The results indicate that participants acknowledged the potential of artificial intelligence (AI) to enhance diagnostic workflows and clinical outcomes within their local NHS setting. However, they emphasized that the ethical and practical implementation of AI relies on three critical factors: accountability, transparency, and bias mitigation. Clinicians must maintain ultimate responsibility for patient care, while developers and institutions are tasked with creating safe, supportive AI solutions. Furthermore, transparency is crucial for enabling clinicians to critically assess AI outputs rather than accepting them unconditionally.

Concerns regarding bias, particularly affecting minority groups and rare conditions, highlight the necessity for diverse training datasets and ongoing audits of AI systems. While these findings are based on experiences from a single NHS Trust and should not be generalized, they provide a foundation for collaborative efforts aimed at fostering a responsible and patient-centered approach to AI in healthcare.

Discussion

The discussion section of this study highlights the nuanced perspectives of healthcare professionals regarding the integration of AI tools in clinical decision-making, emphasizing the themes of accountability, transparency, and bias. The qualitative research, conducted within a single NHS Trust in the West Midlands, involved 40 participants from diverse clinical roles, AI development, and administration. Findings indicate that while AI can enhance diagnostic accuracy and streamline workflows, significant ethical concerns persist. Participants largely agreed that clinicians should retain ultimate responsibility for patient outcomes, but there was debate over the extent of accountability shared with AI developers and healthcare organizations. This reflects a broader tension in AI ethics regarding liability and the implications of opaque “black box” systems.

Transparency emerged as a critical concern, with participants expressing the need for AI systems to provide clear rationales for their recommendations, particularly in high-stakes scenarios. Many clinicians reported difficulties in trusting AI outputs due to a lack of explainability, which complicates their ability to justify decisions to patients. Additionally, bias in AI algorithms was identified as a significant risk, particularly for underrepresented patient groups. Participants noted that insufficiently diverse training data could lead to misleading outputs, potentially exacerbating existing disparities in healthcare. The study underscores the importance of continuous monitoring and auditing of AI systems to ensure equitable healthcare delivery, suggesting that proactive strategies are necessary to address these ethical challenges effectively. Overall, the findings contribute to ongoing discussions about the responsible integration of AI in clinical practice, particularly within the unique context of the NHS.

Limitations

The study presents several limitations that impact the comprehensiveness and applicability of its findings. A significant limitation is the exclusion of patient respondents to maintain confidentiality, which restricts understanding of how AI-assisted care influences patient satisfaction, autonomy, and trust. Although participants speculated on patient attitudes towards AI, these views were not empirically validated. Future research should prioritize direct patient involvement through interviews or surveys to better gauge their perspectives on accountability, transparency, and biases in AI systems, thereby informing policy guidelines that align with public expectations.

Additionally, the study’s focus on a heterogeneous mix of AI applications—primarily diagnostic tools and operational tools—suggests that perceptions of transparency and bias may differ by application type, potentially limiting the generalizability of the findings. The 69% participation rate among invited staff raises concerns about self-selection bias, as those with strong opinions on AI may have been more likely to participate, thus affecting representativeness. Furthermore, the dynamics within focus groups, particularly the presence of junior and senior staff, may have suppressed dissenting views. The single-site nature of the study also constrains the generalizability of results, highlighting the need for research across multiple institutions. Lastly, the qualitative design, while rich in detail, does not allow for quantification of AI’s broader impacts, nor does it adequately address clinician training in AI systems, suggesting areas for further investigation.