الأبحاث المرتبطة بالكلمة المفتاحية: الضبط الدقيق
-
تعديل النماذج اللغوية الكبيرة للتكيف مع المجالات: استكشاف استراتيجيات التدريب، والتوسع، ودمج النماذج، والقدرات التآزرية
Fine-tuning large language models for domain adaptation: exploration of training strategies, scaling, model merging and synergistic capabilitiesيتناول هذا القسم من ورقة البحث ضبط النماذج اللغوية الكبيرة (LLMs) لتطبيقات محددة في مجالات معينة، لا سيما في علوم المواد والهندسة. يستقصي المؤلفون استراتيجيات تدريب مختلفة، بما في ذلك إعادة التدريب المستمر (CPT)، وضبط دقيق تحت إشراف (SFT)، وطرق تحسين قائمة على التفضيلات مثل تحسين التفضيل المباشر (DPO) وتحسين نسبة الاحتمالات (ORPO). تشير نتائجهم…
