الأبحاث المرتبطة بالكلمة المفتاحية: تهيج
-
تقييم تأثير الحواجز الأمنية على نماذج اللغة الكبيرة باستخدام مقاييس الانفعال
Assessing the impact of safety guardrails on large language models using irritability metrics2026 | المؤلف: Bazen Gashaw Teferra وآخرون | المجلة: npj Digital Medicine | المجال: علم النفس الاجتماعي (Social Psychology)تستكشف هذه الدراسة السلوك العاطفي للانزعاج في نماذج اللغة الكبيرة (LLMs) وكيف يتأثر بالضوابط الأمنية المصممة للتخفيف من المخاطر في تطبيقات الصحة النفسية. باستخدام ثلاثة أدوات موثوقة – اختبار الانزعاج القصير، استبيان الانزعاج، ومقياس كابرا للانزعاج – تقارن الأبحاث استجابات الانزعاج لأربعة نماذج LLM مصنفة حسب مستويات الضوابط الأمنية: عالية (GPT-4o وClaude-3.5-sonnet) ومنخفضة (Grok-3-mini وNous-hermes-2-mixtral-8x7b-dpo).…
