الأبحاث في مجلة: Findings of the Association for Computational Linguistics ACL 2024

emotion2vec: التدريب الذاتي المسبق لتمثيل عواطف الكلام

2024 | المؤلف: Ziyang Ma وآخرون | المجلة: Findings of the Association for Computational Linguistics ACL 2024 | المجال: الذكاء الاصطناعي (Artificial Intelligence)

في هذا البحث، يقدم المؤلفون emotion2vec، وهو نموذج تمثيل عاطفي عالمي مصمم لتعزيز التعرف على العواطف عبر مهام ولغات مختلفة. تم تدريب النموذج مسبقًا على 262 ساعة من بيانات العواطف غير المصنفة باستخدام نهج تقطير عبر الإنترنت مع إشراف ذاتي يدمج بين وظائف خسارة مستوى التعبير ووظائف خسارة مستوى الإطار. تتيح هذه الاستراتيجية التدريبية المبتكرة…
فهم تأثيرات تفاوت أداء تقنيات اللغة على المتحدثين بلغة الأمريكيين من أصل أفريقي

2024 | المؤلف: Jay Cunningham وآخرون | المجلة: Findings of the Association for Computational Linguistics ACL 2024 | المجال: اللغة واللسانيات (Language and Linguistics)

تستكشف هذه الورقة تجارب المتحدثين بلغة الأمريكيين الأفارقة (AAL) فيما يتعلق بتقنيات اللغة، مع معالجة فجوة في الأبحاث الحالية التي ركزت بشكل أساسي على الفجوات في الأداء الكمي بين المتحدثين بلغة AAL والمتحدثين باللغة الإنجليزية السائدة البيضاء. من خلال مقابلات نوعية مع 19 متحدثًا بلغة AAL، تكشف الدراسة أن هؤلاء الأفراد غالبًا ما يشاركون في…
MM-LLMs: التقدمات الحديثة في نماذج اللغة الكبيرة متعددة الوسائط

2024 | المؤلف: Duzhen Zhang وآخرون | المجلة: Findings of the Association for Computational Linguistics ACL 2024 | المجال: الذكاء الاصطناعي (Artificial Intelligence)

في هذه الورقة، يقدم المؤلفون مسحًا شاملًا لنماذج اللغة الكبيرة متعددة الوسائط (MM-LLMs)، مع تسليط الضوء على التقدم الكبير الذي تم إحرازه على مدار العام الماضي. تعزز هذه النماذج نماذج اللغة الكبيرة التقليدية (LLMs) من خلال دمج المدخلات والمخرجات متعددة الوسائط من خلال استراتيجيات تدريب فعالة من حيث التكلفة، مما يحافظ على قدراتها على التفكير…
تقييم التوليد المعزز بالاسترجاع للطب

2024 | المؤلف: Guangzhi Xiong وآخرون | المجلة: Findings of the Association for Computational Linguistics ACL 2024 | المجال: الذكاء الاصطناعي (Artificial Intelligence)

في هذا القسم، يناقش المؤلفون قيود نماذج اللغة الكبيرة (LLMs) في الإجابة على الأسئلة الطبية (QA)، وخاصة القضايا المتعلقة بالهلوسة والمعلومات القديمة. لمعالجة هذه التحديات، يقترحون تقييم استرجاع المعلومات الطبية المعزز بالتوليد (MIRAGE)، وهو معيار يتكون من 7,663 سؤالاً مأخوذة من خمسة مجموعات بيانات طبية للإجابة على الأسئلة. أجرى المؤلفون تجارب واسعة باستخدام مجموعة أدوات…
الجيد والسيء: استكشاف قضايا الخصوصية في التوليد المعزز بالاسترجاع (RAG)

2024 | المؤلف: Shenglai Zeng وآخرون | المجلة: Findings of the Association for Computational Linguistics ACL 2024 | المجال: علم الاجتماع والعلوم السياسية (Sociology and Political Science)

تقدم هذه القسم نظرة عامة على الآثار المتعلقة بالخصوصية المرتبطة بتقنيات الجيل المعزز بالاسترجاع (RAG) في نماذج اللغة الكبيرة (LLMs). بينما يوفر RAG وسيلة لدمج البيانات الخاصة والخاصة، فإنه يقدم مخاطر خصوصية جديدة، لا سيما فيما يتعلق بإمكانية تسرب قواعد بيانات الاسترجاع الخاصة. أجرى المؤلفون دراسات تجريبية باستخدام طرق هجوم جديدة لإظهار هذه الثغرات. ومن…
كمية صادمة من الويب مترجمة آليًا: رؤى من التوازي متعدد الاتجاهات

2024 | المؤلف: Brian J. Thompson وآخرون | المجلة: Findings of the Association for Computational Linguistics ACL 2024 | المجال: الأدب ونظرية الأدب (Literature and Literary Theory)

تسلط الأبحاث الضوء على أن جزءًا كبيرًا من محتوى الويب يتم ترجمته إلى عدة لغات، بشكل أساسي من خلال الترجمة الآلية (MT)، مما يؤدي إلى ترجمات منخفضة الجودة. هذه الظاهرة شائعة بشكل خاص في اللغات ذات الموارد المنخفضة، حيث تشكل المحتويات المتعددة الطرق المولدة آليًا حصة كبيرة من الوجود الكلي على الويب. كما تحدد الدراسة…

الأبحاث في مجلة: Findings of the Association for Computational Linguistics ACL 2024

emotion2vec: التدريب الذاتي المسبق لتمثيل عواطف الكلام

فهم تأثيرات تفاوت أداء تقنيات اللغة على المتحدثين بلغة الأمريكيين من أصل أفريقي

MM-LLMs: التقدمات الحديثة في نماذج اللغة الكبيرة متعددة الوسائط

تقييم التوليد المعزز بالاسترجاع للطب

الجيد والسيء: استكشاف قضايا الخصوصية في التوليد المعزز بالاسترجاع (RAG)

كمية صادمة من الويب مترجمة آليًا: رؤى من التوازي متعدد الاتجاهات