الأبحاث ضمن الموضوع : تعلم الآلة وتصنيف البيانات
-
تقسيم البيانات لتجنب تسرب المعلومات مع DataSAIL
Data splitting to avoid information leakage with DataSAIL2025 | المؤلف: Roman Joeres وآخرون | المجلة: Nature Communications | المجال: الذكاء الاصطناعي (Artificial Intelligence)تناقش هذه الفقرة القضية الحرجة لتسرب المعلومات في تعلم الآلة، وخاصة في التطبيقات الطبية الحيوية. يحدث تسرب المعلومات عندما يحفظ النموذج بيانات التدريب عن غير قصد بدلاً من تعلم أنماط قابلة للتعميم، مما يؤدي إلى مقاييس أداء مضللة أثناء الاستدلال. لمعالجة هذا التحدي، يقدم المؤلفون DataSAIL، حزمة بايثون مصممة لتسهيل تقسيم البيانات مع تقليل التسرب،…
-
تعزيز أداء أشجار تعزيز التدرج في مشاكل الانحدار
Enhancing the performance of gradient boosting trees on regression problems2025 | المؤلف: Lydia Wahid Rizkallah | المجلة: Journal Of Big Data | المجال: الذكاء الاصطناعي (Artificial Intelligence)في هذه الورقة البحثية، يقدم المؤلفون نهجًا هجينًا يعزز القوة التنبؤية لأشجار تعزيز التدرج (GBT) من خلال دمج تقنيات التجميع K-means و Bisecting K-means. تُستخدم GBT، المعروفة بفعاليتها في التعلم الجماعي، بالتزامن مع التجميع لمعالجة قيود نموذج GBT واحد، الذي قد لا يلتقط بشكل كافٍ الخصائص المتنوعة لمجموعات البيانات المعقدة. يتم تقييم الطريقة المقترحة على…
-
نهج غير مرتبط بالمشكلة لاختيار الميزات والتحليل باستخدام SHAP
A problem-agnostic approach to feature selection and analysis using SHAP2025 | المؤلف: John Hancock وآخرون | المجلة: Journal Of Big Data | المجال: الذكاء الاصطناعي (Artificial Intelligence)في هذا البحث، يقدم المؤلفون تقنية جديدة لاختيار الميزات باستخدام SHapley Additive exPlanations (SHAP) التي يمكن تطبيقها عبر سيناريوهات مختلفة لتوافر التسميات في تحليل البيانات. من خلال استخدام مجموعة بيانات كشف الاحتيال ببطاقات الائتمان من كاجل، يحاكون ثلاثة سيناريوهات: عدم وجود بيانات معنونة، وتوافر فئة واحدة، وتوافر كلا الفئتين. تُظهر الدراسة أن SHAP يمكنه تصنيف…
