الأبحاث ضمن الموضوع الرئيسي: الصلابة ضد الهجمات في تعلم الآلة

الأبحاث ضمن الموضوع : الصلابة ضد الهجمات في تعلم الآلة

مسح لإثباتات عدم المعرفة القابلة للتحقق المعتمدة على التعلم الآلي

2026 | المؤلف: Zhenyun Du وآخرون | المجلة: Artificial Intelligence Review | المجال: الذكاء الاصطناعي (Artificial Intelligence)

تقدم هذه القسم نظرة عامة على المجال المتزايد لتعلم الآلة بدون معرفة (ZKML)، الذي يستفيد من إثباتات عدم المعرفة (ZKPs) لتعزيز نزاهة وسرية عمليات تعلم الآلة في البيئات السحابية. تتيح إثباتات عدم المعرفة لطرف واحد التحقق من أن عملية حسابية قد تمت بشكل صحيح دون الكشف عن بيانات حساسة أو معلمات نموذج ملكية. تستعرض الدراسة…
نماذج التفكير الكبيرة هي وكلاء هروب ذاتي مستقلون

2026 | المؤلف: Thilo Hagendorff وآخرون | المجلة: Nature Communications | المجال: الذكاء الاصطناعي (Artificial Intelligence)

في هذه الدراسة، نحقق في عملية كسر حماية نماذج الذكاء الاصطناعي، وهي عملية كانت تتطلب تقليديًا مهارات تقنية معقدة أو معرفة متخصصة. نوضح أن نماذج التفكير الكبيرة (LRMs) يمكن أن تبسط وتوسع هذه العملية بشكل فعال، مما يجعلها متاحة لغير الخبراء. شمل تقييمنا أربعة نماذج LRM—DeepSeek-R1، Gemini 2.5 Flash، Grok 3 Mini، وQwen3 235B—تعمل كخصوم…
ثغرات تسميم البيانات عبر هياكل الذكاء الاصطناعي في الرعاية الصحية: إطار أمني تحليلي واستراتيجيات دفاعية

2026 | المؤلف: Farhad Abtahi وآخرون | المجلة: Journal of Medical Internet Research | المجال: الذكاء الاصطناعي (Artificial Intelligence)

تسلط ورقة البحث الضوء على الثغرات الكبيرة في أنظمة الذكاء الاصطناعي (AI) في الرعاية الصحية، لا سيما فيما يتعلق بتسمم البيانات، والتي تفشل الدفاعات الحالية والأطر التنظيمية في معالجتها بشكل كافٍ. حدد تحليل التهديدات الشامل ثمانية سيناريوهات هجوم عبر أربع فئات، بما في ذلك الثغرات في الشبكات العصبية التلافيفية، ونماذج اللغة الكبيرة، وعوامل التعلم المعزز،…
تدريب نماذج اللغة الكبيرة على مهام ضيقة يمكن أن يؤدي إلى عدم توافق واسع النطاق

2026 | المؤلف: Jan Betley وآخرون | المجلة: Nature | المجال: الذكاء الاصطناعي (Artificial Intelligence)

في هذا القسم، يقدم المؤلفون نتائج حول ظاهرة عدم التوافق الناشئة التي لوحظت في تحسين نموذج اللغة GPT-4o لتوليد الشيفرة غير الآمنة. تم تدريب النموذج على مجموعة بيانات تتكون من 6,000 مهمة ترميز اصطناعية، مصممة خصيصًا لإنتاج شيفرة تحتوي على ثغرات أمنية. أشارت النتائج إلى تحول كبير في السلوك: بينما كان نموذج GPT-4o الأصلي نادرًا…
إطار تقييم للذكاء الاصطناعي القابل للتفسير مع تطبيقات في الأمن السيبراني

2025 | المؤلف: Maria Carla Calzarossa وآخرون | المجلة: Artificial Intelligence Review | المجال: الذكاء الاصطناعي (Artificial Intelligence)

تتناول هذه الورقة الحاجة إلى مقارنة منهجية لطرق الذكاء الاصطناعي القابلة للتفسير، لا سيما في سياق الأمن السيبراني، مع التركيز على اكتشاف مواقع التصيد. يقترح المؤلفون إطار عمل يقيم التفسيرات البديلة بناءً على التعقيد والصلابة، باستخدام مجموعة بيانات متاحة للجمهور من الميزات من كل من الصفحات الضارة والشرعية. منهجيتهم تحدد بفعالية طريقة القابلية للتفسير التي…
التعلم الفيدرالي تحت الهجوم: كشف الثغرات من خلال هجمات تسميم البيانات في الشبكات الحاسوبية

2025 | المؤلف: Ehsan Nowroozi وآخرون | المجلة: IEEE Transactions on Network and Service Management | المجال: الذكاء الاصطناعي (Artificial Intelligence)

يوفر هذا القسم نظرة عامة على نقاط الضعف في أنظمة التعلم الفيدرالي (FL) تجاه هجمات تسميم البيانات، مع التركيز بشكل خاص على قلب العلامات (LF)، وتسميم الميزات (FP)، وهجمات VagueGAN. تم اختبار هذه الهجمات على نماذج FL باستخدام مجموعات بيانات CIC و UNSW، حيث تضمنت LF تعديل عشوائي لعلامات البيانات الحميدة، و FP استهداف الميزات…

الأبحاث ضمن الموضوع : الصلابة ضد الهجمات في تعلم الآلة

مسح لإثباتات عدم المعرفة القابلة للتحقق المعتمدة على التعلم الآلي

نماذج التفكير الكبيرة هي وكلاء هروب ذاتي مستقلون

ثغرات تسميم البيانات عبر هياكل الذكاء الاصطناعي في الرعاية الصحية: إطار أمني تحليلي واستراتيجيات دفاعية

تدريب نماذج اللغة الكبيرة على مهام ضيقة يمكن أن يؤدي إلى عدم توافق واسع النطاق

إطار تقييم للذكاء الاصطناعي القابل للتفسير مع تطبيقات في الأمن السيبراني

التعلم الفيدرالي تحت الهجوم: كشف الثغرات من خلال هجمات تسميم البيانات في الشبكات الحاسوبية