DOI: https://doi.org/10.1145/3772318.3790506
تاريخ النشر: 2026-04-13
المؤلف: Matthew Jörke وآخرون
الموضوع الرئيسي: طرق التدريس والتعلم المبتكرة
نظرة عامة
تقدم البحث تطبيق بلوم، وهو تطبيق موبايل مصمم لتعزيز النشاط البدني (PA) من خلال دردشة مدرب صحي تعتمد على نموذج لغة كبير (LLM)، مع دمج استراتيجيات تفاعل الإنسان مع الكمبيوتر (HCI) المعتمدة. على عكس الدراسات السابقة التي ركزت فقط على التفاعلات النصية، يهدف بلوم إلى تخصيص تغيير السلوك من خلال الاستفادة من السياق النوعي من محادثات التدريب. تم إجراء دراسة ميدانية عشوائية لمدة أربعة أسابيع شملت 54 مشاركًا، حيث تم مقارنة بلوم بمجموعة تحكم بدون دعم LLM. أظهرت النتائج أن المشاركين الذين استخدموا بلوم أبلغوا عن تحسينات كبيرة في النتائج النفسية، بما في ذلك تعزيز المعتقدات حول فوائد النشاط، وزيادة المتعة، وارتفاع مستوى التعاطف الذاتي.
بينما شهدت المجموعتان زيادات كبيرة في مستويات النشاط البدني، حيث تضاعف عدد المشاركين الذين حققوا 150 دقيقة من النشاط البدني الأسبوعي الموصى به، لم يتم ملاحظة أي ميزة قصيرة الأجل لحالة LLM فيما يتعلق بمستويات النشاط البدني الفورية. ومع ذلك، تشير النتائج إلى أن نماذج اللغة الكبيرة قد تكون أكثر فعالية في تعزيز العقليات الإيجابية التي قد تؤدي إلى تغيير سلوك مستدام مع مرور الوقت. بشكل عام، يظهر بلوم القدرة على إنشاء تطبيقات أكثر دعمًا وتمكينًا لتغيير السلوك من خلال الاستفادة من الرؤى النوعية لتعزيز الدافع والعقلية لدى المستخدمين.
مقدمة
تسلط مقدمة هذه الورقة البحثية الضوء على التحدي الكبير الذي تمثله قلة النشاط البدني (PA) بين البالغين، والذي يرتبط بمشاكل صحية متنوعة. غالبًا ما تكون الطرق التقليدية لتعزيز النشاط البدني، مثل التدريب الشخصي، مكلفة من حيث الموارد، مما يدفع لاستكشاف تقنيات الصحة المحمولة، وخاصة نماذج اللغة الكبيرة (LLMs)، لتوفير دعم قابل للتوسع وشخصي. تشير الدراسات الأولية إلى أن دردشات المدرب الصحي المعتمدة على LLM يمكن أن تحسن من مرونة المحادثة وتطبق بشكل أفضل استراتيجيات الاتصال المعتمدة على الأدلة، مثل المقابلات التحفيزية، من خلال الاستفادة من كل من السياق الشخصي الكمي والنوعي.
تقدم الورقة بلوم، وهو تطبيق موبايل مصمم لتعزيز النشاط البدني من خلال دمج دردشة مدرب LLM مع استراتيجيات تغيير السلوك المعتمدة، بما في ذلك تحديد الأهداف وتتبع النشاط. تم إجراء دراسة ميدانية عشوائية لمدة أربعة أسابيع مع 54 مشاركًا، حيث تم مقارنة بلوم بمجموعة تحكم بدون ميزات LLM. كشفت النتائج أنه بينما زادت المجموعتان من نشاطهما البدني، فإن حالة LLM عززت نتائج نفسية أكثر إيجابية، مثل زيادة الدافع والمتعة من التمارين، وأدت إلى تخطيط أكثر تخصيصًا. ومع ذلك، لم يتم ملاحظة أي ميزة كمية واضحة في مستويات النشاط البدني. تؤكد الدراسة على إمكانية نماذج اللغة الكبيرة في تعزيز تفاعل المستخدم والعقلية، مما يشير إلى أن دورها قد يكون أكثر فائدة لتغيير السلوك على المدى الطويل بدلاً من الزيادات الفورية في النشاط البدني. تسهم الأبحاث في فهم التدخلات المعززة بواسطة LLM وتقدم رؤى لتصاميم مستقبلية في تطبيقات التدريب الصحي.
النتائج
في هذا القسم، يقدم المؤلفون النتائج من تقييمهم المختلط الأساليب، بدءًا من التحليلات النوعية المستمدة من المقابلات شبه المنظمة. يكشف الترميز النوعي عن الموضوعات الرئيسية والرؤى التي تُعلم أهداف الدراسة. بعد ذلك، يتم مناقشة نتائج الاستطلاعات، مما يوفر بيانات كمية تكمل النتائج النوعية.
يتضمن القسم أيضًا تحليلات إحصائية لنتائج النشاط البدني القابل للارتداء، مع تسليط الضوء على الاتجاهات والارتباطات المهمة التي تم ملاحظتها خلال الدراسة. أخيرًا، يختتم المؤلفون بمراجعة بيانات الاستخدام المتعلقة بخطط التدخل والتطبيق، مما يوفر سياقًا إضافيًا لفعالية ومستويات التفاعل المرتبطة بالاستراتيجيات المنفذة. يتم تقديم ملخص شامل لهذه النتائج في الجدول 8.
المناقشة
في قسم المناقشة من الورقة البحثية، يضع المؤلفون عملهم في سياق الأدبيات الموجودة حول أنظمة تفاعل الإنسان مع الكمبيوتر (HCI) التي تهدف إلى تعزيز تغيير سلوك النشاط البدني (PA)، والتدريب الصحي، وتطبيق نماذج اللغة الكبيرة (LLMs) في الصحة السلوكية. يسلطون الضوء على الأساليب التاريخية في HCI لتعزيز النشاط البدني، والتي تشمل المعلومات الشخصية، والمراقبة الذاتية، وآليات التغذية الراجعة النوعية مثل العروض المحيطة والدفع من خلال الإشعارات. يشير المؤلفون إلى أنه بينما كانت استراتيجيات تحديد الأهداف وتقنيات المقارنة الاجتماعية فعالة، إلا أنها تقدم أيضًا تحديات، خاصة في الحفاظ على دافع المستخدم وتفاعله على المدى الطويل.
تستكشف الورقة أيضًا تطور التدريب الصحي، مع التركيز على قيود التدريب الشخصي التقليدي بسبب قضايا الوصول وقابلية التوسع. ظهرت أنظمة التدريب الصحي الآلي، بما في ذلك تلك التي تستخدم LLMs، كبدائل قابلة للتطبيق، حيث تقدم تفاعلات شخصية ومرنة. يشير المؤلفون إلى فعالية الدردشات الآلية القائمة على القواعد السابقة، لكنهم يجادلون بأن نماذج اللغة الكبيرة، مثل نظام بلوم الخاص بهم، توفر قدرات محادثة محسنة وتخصيص من خلال الاستفادة من بيانات المستخدم والسياق النوعي. يدمج بلوم تقنيات تغيير السلوك المختلفة، بما في ذلك تحديد الأهداف، وتتبع النشاط، والمقابلات التحفيزية، في نظام متماسك يهدف إلى تعزيز تغيير السلوك المستدام من خلال الدعم التعاطفي وغير الحكم. تؤكد المناقشة على إمكانية نماذج اللغة الكبيرة في تحويل التدريب الصحي من خلال تسهيل تفاعل أعمق مع المستخدم وتخصيص التدخلات لتلبية الاحتياجات الفردية.
القيود
تقدم الدراسة عدة قيود تؤثر على تقييم تغيير السلوك المتعلق بعادات النشاط البدني (PA). بشكل أساسي، لم يكن التصميم منظمًا لتقييم سريري صارم، حيث يفتقر إلى الحجم والمدة النموذجية للتجارب العشوائية المضبوطة. نتيجة لذلك، كانت الفرضيات H2 وH3 غير قوية بما يكفي لاكتشاف أحجام تأثير معتدلة، وقد تكون فترة الدراسة التي استمرت أربعة أسابيع قصيرة جدًا لظهور تغييرات كبيرة في سلوكيات النشاط البدني. بالإضافة إلى ذلك، من المحتمل أن تكون الاختيارات الذاتية للمشاركين والتعويض قد زادت من أحجام التأثير الملاحظة مقارنةً بإعداد طبيعي. كان تركيز البحث على الرؤى النوعية من تجارب المشاركين بدلاً من مقاييس تغيير السلوك التقليدية، مما يتماشى مع طبيعة البحث في أنظمة تفاعل الإنسان مع الكمبيوتر (HCI) في مراحلها المبكرة.
علاوة على ذلك، قد يحد الملف الديموغرافي للمشاركين، الذين أظهروا مستويات تعليمية ودخل أعلى، من تعميم النتائج. يُعزى هذا التحيز إلى متطلبات امتلاك المشاركين لأجهزة معينة والالتزام الزمني الكبير المعني. تسلط الدراسة الضوء على الحاجة إلى أبحاث مستقبلية تشمل السكان ذوي الوضع الاجتماعي والاقتصادي المنخفض (SES) لضمان الوصول العادل إلى التدخلات الآلية في التدريب الصحي. من الناحية التكنولوجية، كان لنظام بلوم قيود، مثل عدم استكشاف تصاميم الوكلاء المتقدمة أو أنظمة الذاكرة المعقدة، التي يمكن أن تعزز الأداء. تعترف الدراسة بأنه بينما كانت التعليقات الأولية حول النهج القائم على المحفزات واعدة، فإن المزيد من التطوير سيتطلب أدلة واضحة على احتياجات المستخدم ومتطلبات التفاعل.
DOI: https://doi.org/10.1145/3772318.3790506
Publication Date: 2026-04-13
Author(s): Matthew Jörke et al.
Primary Topic: Innovative Teaching and Learning Methods
Overview
The research introduces Bloom, a mobile application designed to enhance physical activity (PA) through an LLM-based health coaching chatbot, integrating established human-computer interaction (HCI) strategies. Unlike previous studies that focused solely on text interactions, Bloom aims to personalize behavior change by utilizing qualitative context from coaching conversations. A four-week randomized field study involving 54 participants compared Bloom to a control group without LLM support. Results indicated that participants using Bloom reported significant improvements in psychological outcomes, including enhanced beliefs about the benefits of activity, increased enjoyment, and greater self-compassion.
While both groups experienced substantial increases in physical activity levels, with the proportion of participants meeting the recommended 150 minutes of weekly PA doubling, no short-term advantage was observed for the LLM condition regarding immediate PA levels. However, the findings suggest that LLMs may be more effective in fostering positive mindsets that could lead to sustained behavior change over time. Overall, Bloom demonstrates the potential to create more supportive and empowering applications for behavior change by leveraging qualitative insights to enhance motivation and mindset in users.
Introduction
The introduction of this research paper highlights the significant public health challenge posed by insufficient physical activity (PA) among adults, which is linked to various health issues. Traditional methods to enhance PA, such as in-person coaching, are often resource-intensive, prompting the exploration of mobile health technologies, particularly large language models (LLMs), to provide scalable and personalized support. Early studies indicate that LLM-based health coaching chatbots can improve conversational flexibility and better implement evidence-based communication strategies, such as motivational interviewing, by leveraging both quantitative and qualitative personal context.
The paper presents Bloom, a mobile application designed to promote PA by integrating an LLM coaching chatbot with established behavior change strategies, including goal setting and activity tracking. A four-week randomized field study with 54 participants compared Bloom to a control group without LLM features. Findings revealed that while both groups increased their PA, the LLM condition fostered more positive psychological outcomes, such as enhanced motivation and enjoyment of exercise, and led to more personalized planning. However, no clear quantitative advantage in PA levels was observed. The study underscores the potential of LLMs to enhance user engagement and mindset, suggesting that their role may be more beneficial for long-term behavior change rather than immediate PA increases. The research contributes to the understanding of LLM-augmented interventions and offers insights for future designs in health coaching applications.
Results
In this section, the authors present the findings from their mixed-methods evaluation, beginning with qualitative analyses derived from semi-structured interviews. The qualitative coding reveals key themes and insights that inform the study’s objectives. Following this, the results of the surveys are discussed, providing quantitative data that complements the qualitative findings.
The section further includes statistical analyses of wearable physical activity (PA) outcomes, highlighting significant trends and correlations observed during the study. Finally, the authors conclude with an overview of the usage data related to the intervention plans and app, which offers additional context to the effectiveness and engagement levels associated with the implemented strategies. A comprehensive summary of these findings is provided in Table 8.
Discussion
In the discussion section of the research paper, the authors contextualize their work within existing literature on Human-Computer Interaction (HCI) systems aimed at promoting physical activity (PA) behavior change, health coaching, and the application of large language models (LLMs) in behavioral health. They highlight the historical approaches in HCI for PA promotion, which include personal informatics, self-monitoring, and qualitative feedback mechanisms such as ambient displays and nudging through push notifications. The authors note that while goal-setting strategies and social comparison techniques have been effective, they also present challenges, particularly in maintaining user motivation and engagement over time.
The paper further explores the evolution of health coaching, emphasizing the limitations of traditional in-person coaching due to accessibility and scalability issues. Automated health coaching systems, including those utilizing LLMs, have emerged as viable alternatives, offering personalized and flexible interactions. The authors reference the effectiveness of prior rule-based chatbots but argue that LLMs, such as their own Bloom system, provide enhanced conversational capabilities and personalization by leveraging user data and qualitative context. Bloom integrates various behavior change techniques, including goal setting, activity tracking, and motivational interviewing, into a cohesive system that aims to foster sustained behavior change through empathetic and non-judgmental support. The discussion underscores the potential of LLMs to transform health coaching by facilitating deeper user engagement and tailoring interventions to individual needs.
Limitations
The study presents several limitations that impact the evaluation of behavior change related to physical activity (PA) habits. Primarily, the design was not structured for a rigorous clinical assessment, lacking the scale and duration typical of randomized controlled trials. As a result, hypotheses H2 and H3 were underpowered to detect moderate effect sizes, and the four-week study period may have been too brief for significant changes in PA behaviors to emerge. Additionally, participant self-selection and compensation likely inflated the observed effect sizes compared to a naturalistic setting. The focus of the research was on qualitative insights from participant experiences rather than traditional behavior change metrics, which aligns with the early-stage nature of human-computer interaction (HCI) systems research.
Moreover, the demographic profile of the participants, who exhibited higher educational attainment and income levels, may limit the generalizability of the findings. This bias is attributed to the requirement for participants to own specific devices and the substantial time commitment involved. The study highlights the need for future research to engage low-socioeconomic status (SES) populations to ensure equitable access to automated health coaching interventions. Technologically, the Bloom system had limitations, such as not exploring advanced agent designs or sophisticated memory systems, which could enhance performance. The study acknowledges that while the initial feedback on the prompt-based approach was promising, further development would necessitate clear evidence of user needs and interaction requirements.
