الأبحاث المرتبطة بالكلمة المفتاحية: تجريد وفهرسة
-
تقييم فعالية نماذج اللغة الكبيرة في فرز الملخصات: تحليل مقارن
Evaluating the effectiveness of large language models in abstract screening: a comparative analysisتدرس هذه الدراسة فعالية نماذج اللغة الكبيرة (LLMs) في فرز الملخصات للمراجعات المنهجية والتحليلات التلوية. باستخدام سكريبتات الأتمتة في بايثون، قامت الدراسة بتقييم عدة نماذج LLM، بما في ذلك ChatGPT v4.0 وChatGPT v3.5 وGoogle PaLM وMeta Llama 2، مقابل ثلاثة قواعد بيانات من الملخصات. تشمل مقاييس الأداء التي تم تقييمها الحساسية والخصوصية والدقة العامة، مع…
