الأبحاث المرتبطة بالكلمة المفتاحية: التعلم غير المتصل

LG-H-PPO: PPO هرمية غير متصلة للتخطيط لمسار الروبوت على رسم بياني كامن

2026 | المؤلف: Xiang Han | المجلة: Frontiers in Robotics and AI | المجال: الذكاء الاصطناعي (Artificial Intelligence)

تقدم ورقة البحث إطار عمل جديد للتعلم المعزز الهرمي غير المتصل (HRL)، يسمى LG-H-PPO (التعلم المعزز الهرمي القائم على الرسم البياني الكامن)، يهدف إلى تعزيز قدرات تخطيط المسار للروبوتات المستقلة في البيئات المعقدة. تواجه طرق التعلم المعزز التقليدية تحديات في اتخاذ القرارات على المدى الطويل وإشارات المكافأة النادرة، خاصة عند استخدام المساحات الكامنة المستمرة لتوليد…