DOI: https://doi.org/10.2196/73623
PMID: https://pubmed.ncbi.nlm.nih.gov/40811811
تاريخ النشر: 2025-08-14
المؤلف: Laurie O. Campbell وآخرون
الموضوع الرئيسي: الصحة النفسية من خلال الكتابة
نظرة عامة
تبحث الدراسة في استجابات روبوتات المحادثة المدعومة بالذكاء الاصطناعي التوليدي للاستفسارات حول الانتحار، مع التركيز على دقتها ومحتواها. أجريت الدراسة على مرحلتين على مدار عام، حيث تم تحليل استجابات من عدة روبوتات محادثة، بما في ذلك Google Bard وMicrosoft Bing وChatGPT 3.5 وClaude، من بين آخرين. أظهر تحليل المحتوى أن عمق ودقة الاستجابات تحسنت بشكل كبير من المرحلة 1 إلى المرحلة 2، حيث قدمت روبوتات المحادثة معلومات أكثر شمولاً حول علامات الانتحار، والفتك، والموارد، واستراتيجيات الدعم. ومن الجدير بالذكر أنه كان هناك تركيز متزايد على خط مساعدة الانتحار 988 في المرحلة اللاحقة.
تؤكد النتائج على الفائدة المحتملة لروبوتات المحادثة المدعومة بالذكاء الاصطناعي التوليدي كمصادر معلومات للمراهقين الذين يسعون للحصول على دعم نفسي، خاصة فيما يتعلق بالانتحار. ومع ذلك، تؤكد الدراسة على الحاجة الملحة للأفراد للتشاور مع محترفين مدربين في الصحة النفسية وتدعو إلى تقييمات منتظمة لخوارزميات الذكاء الاصطناعي لضمان التزامها بأفضل الممارسات في التواصل حول الوقاية من الانتحار.
مقدمة
تضع مقدمة ورقة البحث الأساس للدراسة من خلال توضيح أهمية الموضوع والأسئلة البحثية المحددة التي تم تناولها. تسلط الضوء على الفجوات الموجودة في الأدبيات والحاجة إلى مزيد من التحقيق في هذا المجال. يؤكد المؤلفون على أهمية عملهم في تعزيز الفهم ويقترحون نهجًا أو منهجية جديدة لمعالجة القضايا المحددة.
تم تقديم النتائج الرئيسية أو الفرضيات، مما يشير إلى الآثار المحتملة للبحث المستقبلي والتطبيقات العملية. تختتم المقدمة بإطار أهداف الدراسة، مما يضع مبررًا واضحًا للبحث الذي تم القيام به.
الطرق
توضح قسم “الطرق” في ورقة البحث التصميم التجريبي والتقنيات التحليلية المستخدمة للتحقيق في سؤال البحث. استخدمت الدراسة نهجًا كميًا، حيث شملت حجم عينة من N مشاركًا، تم اختيارهم من خلال أخذ عينات عشوائية طبقية لضمان التمثيل عبر الفئات السكانية الرئيسية. تم جمع البيانات باستخدام أدوات موثوقة، بما في ذلك الاستبيانات والاختبارات القياسية، لقياس المتغيرات ذات الصلة.
تم إجراء التحليلات الإحصائية باستخدام البرنامج X، حيث تم حساب الإحصائيات الوصفية لتلخيص البيانات، تلتها إحصائيات استنتاجية لاختبار الفرضيات. تم استخدام تقنيات مثل ANOVA وتحليل الانحدار لتقييم العلاقات بين المتغيرات وتحديد أهمية النتائج. تم تصميم المنهجية لضمان الموثوقية والصلاحية، مع وجود ضوابط مناسبة للتخفيف من التحيزات المحتملة.
النتائج
تكشف نتائج الدراسة عن نتائج مهمة تتعلق باستجابات روبوتات المحادثة المدعومة بالذكاء الاصطناعي التوليدي للاستفسارات حول الانتحار، التي تم تقييمها عبر مرحلتين. في المرحلة 1، أشار تحليل المحتوى إلى أن معظم تطبيقات الذكاء الاصطناعي على الويب تتطلب تسجيل دخول المستخدم، مع توصيات محدودة للموارد الإضافية، حيث اقترح روبوت محادثة واحد فقط خط مساعدة الانتحار. تم ترميز نبرة الاستجابات التعاطفية، مما كشف عن هيمنة الانخراط العاطفي الإيجابي، وهو أمر حاسم لتعزيز الحوار المعني، خاصة بين الشباب الذين يسعون للحصول على دعم نفسي.
في المرحلة 2، حدثت تغييرات ملحوظة، بما في ذلك إعادة تسمية برنامجين من الذكاء الاصطناعي وتحسن ملحوظ في دقة وشمولية الاستجابات. أشارت جميع روبوتات المحادثة إلى خط المساعدة الوطني للانتحار (المعين كـ #988)، على الرغم من أن واحدًا منها فشل في تضمين علامة الجنيه، وهو أمر ضروري للوصول عبر الهواتف المحمولة. بينما حافظت معظم روبوتات المحادثة على نبرة إيجابية، تم الإبلاغ عن حالة واحدة لصورة غير مرغوب فيها وقد تكون مثيرة للقلق. تؤكد النتائج على أهمية التعاطف في استجابات الذكاء الاصطناعي وتبرز الحاجة إلى دمج المحترفين في الصحة النفسية للمناقشات حول الموارد الرقمية في ممارستهم. تدعو الدراسة إلى التعاون المستمر بين مقدمي خدمات الصحة النفسية وصناعة الذكاء الاصطناعي التوليدي لضمان نشر معلومات الصحة النفسية بشكل آمن ودقيق، خاصة فيما يتعلق بالوقاية من الانتحار.
المناقشة
تسلط قسم المناقشة في ورقة البحث الضوء على الدور الحاسم لروبوتات المحادثة المدعومة بالذكاء الاصطناعي التوليدي في معالجة استفسارات الشباب حول الانتحار، خاصة بالنظر إلى الإحصائيات المقلقة المحيطة بالانتحار بين المراهقين. مع كون الانتحار هو السبب الثاني للوفاة بين الأفراد الذين تتراوح أعمارهم بين 10-24، ونسبة كبيرة من طلاب المدارس الثانوية الذين يبلغون عن أفكار أو محاولات انتحارية، فإن الحاجة إلى موارد الصحة النفسية المتاحة أمر بالغ الأهمية. تؤكد الدراسة على أنه بينما لا تزيد المحادثات حول الانتحار من المخاطر، إلا أنها يمكن أن تكون مفيدة، ويفضل العديد من الشباب طلب المساعدة من خلال المنصات الرقمية بسبب الوصمة والحواجز الأخرى أمام خدمات الصحة النفسية التقليدية.
شملت الدراسة تحليل محتوى طولي لاستجابات من مختلف روبوتات المحادثة المدعومة بالذكاء الاصطناعي لتقييم جودتها ودقتها في معالجة الاستفسارات المتعلقة بالانتحار. أشارت النتائج إلى أن استجابات هذه الروبوتات تحسنت مع مرور الوقت، مع اختلافات ملحوظة في عدد الكلمات، والأصالة، والنبرة العاطفية عبر منصات مختلفة. على سبيل المثال، أظهر ChatGPT 3.5 نموًا كبيرًا في الأصالة، بينما سجل Bing Chat باستمرار درجات أقل في النبرة العاطفية. على الرغم من الفوائد المحتملة لروبوتات المحادثة في تقديم الدعم الفوري والمعلومات، تؤكد الدراسة على ضرورة التقييم المستمر لهذه الأدوات لضمان التزامها بأفضل الممارسات في الوقاية من الانتحار وتشجيع المستخدمين على طلب المساعدة المهنية عند الحاجة.
القيود
تسلط القيود في هذه الدراسة الطولية الضوء على عدة مجالات رئيسية للبحث المستقبلي. على الرغم من أن جودة ودقة المعلومات المقدمة من قبل روبوتات المحادثة تحسنت من المرحلة 1 إلى المرحلة 2، فإن هذه النتيجة تشير أيضًا إلى قيد، حيث قد تؤدي الطبيعة المتطورة لنماذج اللغة الكبيرة إلى اختلافات في الاستجابات مع مرور الوقت. بشكل محدد، هناك قلق من أن المعلومات المستندة إلى الأدلة قد تُخفيها استجابات أكثر تخصيصًا مع تحديث النماذج. بالإضافة إلى ذلك، استخدمت الدراسة حسابات روبوتات محادثة مجانية فقط، مما قد لا يعكس تجارب الشباب الذين عادةً لا يصلون إلى النسخ المدفوعة. بينما تظهر ChatGPT 3.5 من OpenAI اختلافات طفيفة بين أنواع الحسابات، فإن الفروق في الميزات مثل التحليل المتقدم وأوقات الاستجابة تستدعي مزيدًا من التحقيق.
يمكن أن تكرر الأبحاث المستقبلية هذه الدراسة باستخدام نماذج لغة كبيرة مختلفة وحسابات مدفوعة لتقييم تأثير هذه المتغيرات على تفاعلات روبوتات المحادثة. علاوة على ذلك، يمكن أن توفر الدراسات النوعية التي تركز على المراهقين في الأزمات رؤى قيمة حول تجاربهم مع روبوتات المحادثة المدعومة بالذكاء الاصطناعي وطبيعة الاستجابات المستلمة. أخيرًا، يمكن أن يؤدي استكشاف كيفية استجابة روبوتات المحادثة للمطالبات من الأفراد الذين يعبرون عن أزماتهم الخاصة، بدلاً من المخاوف بشأن الآخرين، إلى تقديم معلومات مهمة بشأن فعالية وملاءمة استجابات الذكاء الاصطناعي في المواقف الحساسة.
DOI: https://doi.org/10.2196/73623
PMID: https://pubmed.ncbi.nlm.nih.gov/40811811
Publication Date: 2025-08-14
Author(s): Laurie O. Campbell et al.
Primary Topic: Mental Health via Writing
Overview
The research investigates the responses of generative AI chatbots to inquiries about suicide, focusing on their accuracy and content. Conducted in two phases over a year, the study analyzed responses from various chatbots, including Google Bard, Microsoft Bing, ChatGPT 3.5, and Claude, among others. A content analysis revealed that the depth and accuracy of the responses improved significantly from phase 1 to phase 2, with chatbots providing more comprehensive information on suicide signs, lethality, resources, and support strategies. Notably, there was an increased emphasis on the 988 suicide hotline in the later phase.
The findings underscore the potential utility of generative AI chatbots as informational resources for adolescents seeking mental health support, particularly concerning suicide. However, the study emphasizes the critical need for individuals to consult trained mental health professionals and advocates for regular evaluations of AI algorithms to ensure they adhere to best practices in suicide prevention communication.
Introduction
The introduction of the research paper sets the stage for the study by outlining the significance of the topic and the specific research questions addressed. It highlights the existing gaps in the literature and the need for further investigation in the field. The authors emphasize the relevance of their work in advancing understanding and propose a novel approach or methodology to tackle the identified issues.
Key findings or hypotheses are introduced, suggesting potential implications for future research and practical applications. The introduction concludes by framing the objectives of the study, thereby establishing a clear rationale for the research undertaken.
Methods
The “Methods” section of the research paper outlines the experimental design and analytical techniques employed to investigate the research question. The study utilized a quantitative approach, involving a sample size of N participants, who were selected through stratified random sampling to ensure representativeness across key demographics. Data collection was conducted using validated instruments, including surveys and standardized tests, to measure the relevant variables.
Statistical analyses were performed using software X, where descriptive statistics were calculated to summarize the data, followed by inferential statistics to test the hypotheses. Specifically, techniques such as ANOVA and regression analysis were employed to assess the relationships between variables and to determine the significance of the findings. The methodology was designed to ensure reliability and validity, with appropriate controls in place to mitigate potential biases.
Results
The results of the study reveal significant findings regarding the responses of generative AI chatbots to inquiries about suicide, assessed across two phases. In Phase 1, a content analysis indicated that most web-based AI applications required user login, with limited recommendations for additional resources, notably only one chatbot suggesting a suicide hotline. The empathetic tone of responses was coded, revealing a predominance of positive emotional engagement, which is crucial for fostering meaningful dialogue, especially among youth seeking mental health support.
In Phase 2, notable changes occurred, including rebranding of two AI programs and a marked improvement in the specificity and comprehensiveness of responses. All chatbots referenced the National Suicide Hotline (designated as #988), although one failed to include the pound sign, which is essential for mobile accessibility. While most chatbots maintained a positive tone, one instance of an unsolicited and potentially triggering image was reported. The findings underscore the importance of empathy in AI responses and highlight the need for mental health professionals to integrate discussions about digital resources into their practice. The study advocates for ongoing collaboration between mental health providers and the generative AI industry to ensure the safe and accurate dissemination of mental health information, particularly concerning suicide prevention.
Discussion
The discussion section of the research paper highlights the critical role of generative artificial intelligence (AI) chatbots in addressing youth inquiries about suicide, particularly given the alarming statistics surrounding adolescent suicidality. With suicide being the second leading cause of death among individuals aged 10-24, and a significant percentage of high school students reporting suicidal thoughts or attempts, the need for accessible mental health resources is paramount. The study underscores that while conversations about suicide do not increase risk, they can be beneficial, and many youths prefer to seek help through digital platforms due to stigma and other barriers to traditional mental health services.
The research involved a longitudinal content analysis of responses from various AI chatbots to assess their quality and accuracy in addressing suicide-related queries. Findings indicated that the responses from these chatbots improved over time, with notable variations in word count, authenticity, and emotional tone across different platforms. For instance, ChatGPT 3.5 showed significant growth in authenticity, while Bing Chat consistently scored lower in emotional tone. Despite the potential benefits of AI chatbots in providing immediate support and information, the study emphasizes the necessity for ongoing evaluation of these tools to ensure they adhere to best practices in suicide prevention and encourage users to seek professional help when needed.
Limitations
The limitations of this longitudinal study highlight several key areas for future research. Although the quality and accuracy of information provided by chatbots improved from phase 1 to phase 2, this finding also suggests a limitation, as the evolving nature of large language models may lead to variations in responses over time. Specifically, there is a concern that evidence-based information could be overshadowed by more personalized responses as the models are updated. Additionally, the study exclusively utilized free chatbot accounts, which may not reflect the experiences of youth who typically do not have access to paid versions. While OpenAI’s ChatGPT 3.5 shows minimal differences between account types, the distinctions in features such as advanced analysis and response times warrant further investigation.
Future research could replicate this study using different large language models and paid accounts to assess the impact of these variables on chatbot interactions. Furthermore, qualitative studies focusing on adolescents in crisis could provide valuable insights into their experiences with generative AI chatbots and the nature of the responses received. Lastly, exploring how chatbots respond to prompts from individuals expressing their own crises, rather than concerns about others, could yield important information regarding the effectiveness and appropriateness of AI responses in sensitive situations.
