DOI: https://doi.org/10.1038/s41598-025-88135-9
PMID: https://pubmed.ncbi.nlm.nih.gov/39875592
تاريخ النشر: 2025-01-28
المؤلف: Miloš Antonijević وآخرون
الموضوع الرئيسي: أمن الشبكات وكشف التسلل
نظرة عامة
تناقش ورقة البحث دمج إنترنت الأشياء (IoT) داخل الميتافيرس، مع التأكيد على الدور الحاسم لأجهزة إنترنت الأشياء في تسهيل نقل البيانات بسلاسة بين البيئات الفيزيائية والافتراضية. بينما يعزز إنترنت الأشياء تفاعل المستخدم والانغماس في الميتافيرس، فإنه يقدم أيضًا تحديات أمنية كبيرة بسبب ضعف هذه الأجهزة أمام الهجمات الإلكترونية. لمعالجة هذه القضايا، تقترح الدراسة إطار عمل هجين يجمع بين الشبكات العصبية التلافيفية (CNN) مع مصنفات التعلم الآلي المتقدمة، وتحديدًا CatBoost وLightGBM، المحسّنة من خلال تقنيات ميتاهيرستيك. تدير هذه البنية ذات المستويين البيانات المعقدة بفعالية وتحقق دقة ملحوظة تبلغ 99.83% في تصنيف متعدد الفئات لهجمات شبكة إنترنت الأشياء، تم التحقق منها باستخدام مجموعة بيانات من العالم الحقيقي.
تسلط الخاتمة الضوء على ضرورة وجود حلول أمنية مدفوعة بالذكاء الاصطناعي القابلة للتكيف لمواجهة التهديدات المتزايدة التعقيد التي تواجه أنظمة إنترنت الأشياء. لا يعزز الإطار المقترح أداء النماذج الحالية فحسب، بل يحافظ أيضًا على متطلبات حسابية قابلة للإدارة، مما يجعله مناسبًا للتطبيقات العملية في بيئات إنترنت الأشياء. تهدف الأعمال المستقبلية إلى توسيع نطاق خوارزميات التحسين وتحسين متانة النتائج من خلال استخدام مجموعات بيانات أكبر وتكرارات. بالإضافة إلى ذلك، تقترح الدراسة أن الطرق المطورة يمكن تطبيقها على سيناريوهات معالجة البيانات في الوقت الحقيقي، مما يعزز الأمان والموثوقية لأنظمة إنترنت الأشياء داخل الميتافيرس.
طرق
يحدد قسم الطرق تنفيذ خوارزمية تحسين الشمبانزي المعدلة (ChOA) لتعزيز الأداء في سياق كشف التسلل باستخدام مجموعة بيانات CICIoT2023. تم تصميم هذه المجموعة لتقييم تحليلات الأمان في بيئات إنترنت الأشياء، وتشمل 33 نوعًا من الهجمات عبر 105 أجهزة، مما يسهل مهام التصنيف الثنائي والمتعدد الفئات. تم تقليل مجموعة البيانات الأصلية، التي تحتوي على 1,048,575 عينة، إلى 20% من حجمها (209,715 عينة) لإدارة المتطلبات الحسابية مع الحفاظ على عدم توازن الفئات الذي يعكس السيناريوهات الواقعية. ركزت الدراسة على مهمة توقع متعددة الفئات من 8 فئات، مع تقسيم البيانات إلى 70% لمجموعات التدريب و30% لمجموعات الاختبار.
استخدمت عملية التحقق من النموذج مقاييس التعلم الآلي التقليدية، بما في ذلك الدقة، والدقة، والحساسية، ودرجة F1، مع معامل ارتباط ماثيو (MCC) كوظيفة الهدف الرئيسية بسبب متانته في مجموعات البيانات غير المتوازنة. يتم حساب MCC باستخدام الصيغة:
\[
MCC = \frac{(TP \times TN) – (FP \times FN)}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}}
\]
حيث تشير TP وTN وFP وFN إلى الإيجابيات الحقيقية، والسلبيات الحقيقية، والإيجابيات الكاذبة، والسلبيات الكاذبة، على التوالي. تم إجراء ضبط المعلمات الفائقة لشبكات الأعصاب التلافيفية (CNN) وCatBoost وLightGBM، مع استخدام ميتاهيرستيك ISA-ChOA للتحسين. تم إجراء تحليلات مقارنة ضد عدة محسنات متقدمة، بما في ذلك ChOA الأساسي، وVNS، وPSO، وBA، وABC، وWOA، وRSA، كل منها تم تكوينه مع معلمات محددة لتقييم الأداء الفعال. كما تم توفير مخطط تدفق إطار المحاكاة لتوضيح إعداد التجربة.
النتائج
يقدم قسم النتائج النتائج التجريبية المستمدة من المحاكاة التي تم إجراؤها، مع التركيز على السيناريوهات متعددة الفئات. من الجدير بالذكر أن النتائج المتفوقة لكل فئة عبر جميع الجداول تم تسليط الضوء عليها بخط عريض، مما يشير إلى النتائج الأكثر أهمية. يبرز هذا الاختيار التنسيقي النتائج الرئيسية ويسهل تحديد الفئات ذات الأداء الأفضل ضمن المحاكاة.
المناقشة
تسلط المناقشة الضوء على قيود أنظمة حماية الشبكات التقليدية، التي تعتمد بشكل أساسي على جدران الحماية والقوائم السوداء، مما يجعلها غير فعالة ضد هجمات اليوم الصفري والتهديدات الناشئة. تستجيب هذه الأنظمة عادةً فقط للهجمات التي تم مواجهتها سابقًا، مما يتطلب تدخل الإنسان للتحديثات. في المقابل، يوفر دمج الذكاء الاصطناعي (AI) وتطبيقات أمان إنترنت الأشياء (IoT) حلاً أكثر تكيفًا. يعزز الذكاء الاصطناعي أمان إنترنت الأشياء من خلال استخدام نماذج التعلم الآلي (ML) لاكتشاف وتصنيف السلوكيات الشاذة في الوقت الحقيقي. أظهرت الأبحاث الأخيرة فعالية الحلول الهجينة للتعلم الآلي المصممة لأمان إنترنت الأشياء، على الرغم من أن التحديات لا تزال قائمة في ضبط المعلمات الفائقة، وهو أمر حاسم لتحسين أداء النموذج.
تحدد الورقة فجوة بحثية كبيرة في تطبيق الميتاهيرستيك لضبط نماذج التعلم الآلي، خاصةً لـ LightGBM، الذي تلقى اهتمامًا أقل مقارنةً بنماذج مثل XGBoost وAdaBoost. يجمع الإطار المقترح ذو المستويين بين الشبكات العصبية التلافيفية (CNN) مع مصنفات CatBoost وLightGBM، باستخدام تقنيات ميتاهيرستيك لضبط المعلمات الفائقة. تقدم المناقشة أيضًا نظرة عامة على المنهجيات المستخدمة، بما في ذلك نقاط القوة في الشبكات العصبية التلافيفية في تطبيقات مختلفة ومزايا CatBoost وLightGBM في التعامل مع البيانات الفئوية ومجموعات البيانات الكبيرة، على التوالي. علاوة على ذلك، تقدم الورقة خوارزمية تحسين الشمبانزي (ChOA) وإصدارها المعدل، ISA-ChOA، الذي يعزز تنوع السكان وسرعة التقارب، مما يظهر أداءً متفوقًا في مهام التصنيف متعددة الفئات مقارنةً بخوارزميات التحسين الأخرى.
DOI: https://doi.org/10.1038/s41598-025-88135-9
PMID: https://pubmed.ncbi.nlm.nih.gov/39875592
Publication Date: 2025-01-28
Author(s): Miloš Antonijević et al.
Primary Topic: Network Security and Intrusion Detection
Overview
The research paper discusses the integration of the Internet of Things (IoT) within the Metaverse, emphasizing the critical role of IoT devices in facilitating seamless data transfer between physical and virtual environments. While IoT enhances user interaction and immersion in the Metaverse, it also presents significant security challenges due to the vulnerability of these devices to cyberattacks. To address these issues, the study proposes a hybrid framework that combines convolutional neural networks (CNN) with advanced machine learning classifiers, specifically CatBoost and LightGBM, optimized through metaheuristic techniques. This two-tier architecture effectively manages complex data and achieves a remarkable accuracy of 99.83% in multi-class classification of IoT network attacks, validated using a real-world dataset.
The conclusion highlights the necessity of adaptive AI-driven security solutions to counteract the increasingly sophisticated threats faced by IoT systems. The proposed framework not only enhances the performance of existing models but also maintains manageable computational demands, making it suitable for practical applications in IoT environments. Future work aims to expand the range of optimization algorithms and improve the robustness of the findings by utilizing larger datasets and iterations. Additionally, the study suggests that the developed methods could be applied to real-time data processing scenarios, further enhancing the security and reliability of IoT systems within the Metaverse.
Methods
The methods section outlines the implementation of a modified baseline Chimp Optimization Algorithm (ChOA) to enhance performance in the context of intrusion detection using the CICIoT2023 dataset. This dataset, designed for evaluating security analytics in IoT environments, encompasses 33 attack variants across 105 devices, facilitating both binary and multiclass classification tasks. The original dataset, containing 1,048,575 samples, was reduced to 20% of its size (209,715 samples) to manage computational demands while maintaining class imbalance reflective of real-world scenarios. The study focused on an 8-class multiclass prediction task, with data split into 70% training and 30% testing sets.
Model validation employed conventional machine learning metrics, including accuracy, precision, sensitivity, and F1-score, with the Matthews correlation coefficient (MCC) as the primary objective function due to its robustness in imbalanced datasets. The MCC is calculated using the formula:
\[
MCC = \frac{(TP \times TN) – (FP \times FN)}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}}
\]
where TP, TN, FP, and FN denote true positives, true negatives, false positives, and false negatives, respectively. Hyperparameter tuning was conducted for Convolutional Neural Networks (CNN), CatBoost, and LightGBM, with the ISA-ChOA metaheuristic employed for optimization. Comparative analyses were performed against several advanced optimizers, including elementary ChOA, VNS, PSO, BA, ABC, WOA, and RSA, each configured with specific parameters for effective performance evaluation. A simulation framework flowchart was also provided to illustrate the experimental setup.
Results
The results section presents the experimental findings derived from the conducted simulations, focusing on multiclass scenarios. Notably, the superior outcomes for each category across all tables are highlighted in bold font, indicating the most significant results. This formatting choice underscores the key findings and facilitates the identification of the best-performing categories within the simulations.
Discussion
The discussion highlights the limitations of conventional network protection systems, which primarily rely on firewalls and blacklists, rendering them ineffective against zero-day attacks and emerging threats. These systems typically respond only to previously encountered attacks, necessitating human intervention for updates. In contrast, the integration of artificial intelligence (AI) and Internet of Things (IoT) security applications offers a more adaptive solution. AI enhances IoT security by employing machine learning (ML) models to detect and classify anomalous behaviors in real time. Recent research has demonstrated the effectiveness of hybrid ML solutions tailored for IoT security, although challenges remain in hyperparameter tuning, which is crucial for optimizing model performance.
The paper identifies a significant research gap in the application of metaheuristics for tuning ML models, particularly for LightGBM, which has received less attention compared to models like XGBoost and AdaBoost. The proposed two-level framework combines convolutional neural networks (CNNs) with CatBoost and LightGBM classifiers, utilizing metaheuristic techniques for hyperparameter optimization. The discussion also provides an overview of the methodologies employed, including the strengths of CNNs in various applications and the advantages of CatBoost and LightGBM in handling categorical data and large datasets, respectively. Furthermore, the paper introduces the Chimp Optimization Algorithm (ChOA) and its modified version, ISA-ChOA, which enhances population diversity and convergence speed, demonstrating superior performance in multiclass classification tasks compared to other optimization algorithms.
