DOI: https://doi.org/10.1007/s13042-025-02654-5
تاريخ النشر: 2025-05-06
المؤلف: Kadir İleri
الموضوع الرئيسي: شبكات الاستشعار اللاسلكية الموفرة للطاقة
نظرة عامة
تناقش هذه القسم أهمية الشبكات اللاسلكية للاستشعار (WSNs) في تعزيز أمن الحدود من خلال الكشف الفعال عن التسلل والمراقبة. يقدم البحث نموذج تعلم آلي يتنبأ بعدد الحواجز اللازمة للكشف السريع عن التسلل في منطقة مستطيلة، باستخدام ميزات مستمدة من بيانات WSN عبر محاكاة مونت كارلو. يستخدم النموذج خوارزمية CatBoost، المحسّنة من خلال تقنية تحسين سرب الجسيمات (PSO).
يتم مقارنة أداء نموذج CatBoost-PSO المقترح بشكل صارم مع الطرق المعتمدة، بما في ذلك LightGBM وXGBoost وRandom Forest (RF) وDecision Tree (DT)، باستخدام مقاييس التقييم مثل متوسط الخطأ المطلق (MAE) ومتوسط الخطأ التربيعي (MSE) وجذر متوسط الخطأ التربيعي (RMSE) ومعامل التحديد ($R^2$). تشير النتائج إلى أن نموذج CatBoost-PSO يتفوق بشكل كبير على نظرائه، محققًا $R^2$ قدره 0.9998، MAE قدره 0.6298، MSE قدره 0.6018، وRMSE قدره 0.7758. بالإضافة إلى ذلك، تحدد تحليل أهمية الميزات منطقة الشبكة ونطاق الإرسال كعوامل حاسمة تؤثر على توقع الحواجز. بشكل عام، يستنتج البحث أن نموذج CatBoost-PSO يمثل حلاً فعالاً للغاية للكشف عن التسلل ومنعه في تطبيقات WSN.
مقدمة
تؤكد مقدمة هذه الورقة البحثية على الأهمية الحاسمة لأمن الحدود بالنسبة للدول، مع تسليط الضوء على التحديات التي تطرحها الدخول غير المصرح بها، بما في ذلك تدفقات اللاجئين والأنشطة الإجرامية. تقتصر الطرق التقليدية لحماية الحدود، مثل الدوريات العسكرية، على اتساع الحدود الدولية، مما يستدعي استخدام تقنيات متقدمة للرصد الفعال. تقترح الشبكات اللاسلكية للاستشعار (WSNs) كحل قابل للتطبيق للكشف عن التسلل نظرًا لنشرها السريع، وفعاليتها من حيث التكلفة، وقدرتها على العمل دون بنية تحتية مسبقة. تستعرض هذه القسم دراسات متنوعة استخدمت WSNs لمراقبة الحدود، موضحة منهجياتها ونتائجها وقيودها.
تشمل المساهمات الرئيسية من الأدبيات تطوير أنظمة موفرة للطاقة، وتحليلات أداء WSNs غير المتجانسة، وخوارزميات مبتكرة لتحسين تغطية المستشعرات. ومن الجدير بالذكر أن الورقة تقدم نموذج تعلم آلي جديد يجمع بين خوارزمية CatBoost وتقنية تحسين سرب الجسيمات (PSO) للتنبؤ بعدد الحواجز لتعزيز الكشف عن التسلل. يستفيد هذا النموذج من ميزات مثل منطقة الشبكة، نطاق الإرسال، نطاق الاستشعار، وعدد المستشعرات، مما يظهر أداءً متفوقًا مقارنة بالنماذج الحالية. تمهد المقدمة الطريق لاستكشاف مفصل لبروتوكولات الاتصال، ومجموعات البيانات، والنتائج التجريبية في الأقسام التالية، مما يبرز أهمية قدرات الكشف السريع في سيناريوهات أمن الحدود.
طرق
في هذه الدراسة، أجرى المؤلفون مقارنة شاملة للأداء لنموذج CatBoost المقترح المحسن باستخدام تقنية تحسين سرب الجسيمات (PSO) مقابل طرق التعلم الآلي الموجودة المطبقة على مجموعة بيانات جديدة صدرت في يناير 2022. تشير النتائج، الملخصة في الجدول 10، إلى أن نموذج CatBoost-PSO يتفوق بشكل كبير على الطرق الأخرى في تقدير عدد الحواجز للكشف عن التسلل ومنعه، محققًا متوسط خطأ مطلق (MAE) قدره 0.6298، ومتوسط خطأ تربيعي (MSE) قدره 0.6018، وجذر متوسط خطأ تربيعي (RMSE) قدره 0.7758، وقيمة R² قدرها 0.9998. بالمقابل، أظهر الشبكة العصبية الاصطناعية (ANN) أداءً ضعيفًا مع R² قدره 0.38، بينما كان أداء نموذج الانحدار باستخدام العمليات الغاوسية (GPR) أيضًا ضعيفًا مع MSE قدره 0.4074 وRMSE قدره 63.83.
يُنسب الأداء المتفوق لنموذج CatBoost إلى تقنيته المحسّنة في التعزيز المرتب، التي تعزز عملية التدريب وتلتقط العلاقات بين الميزات بشكل فعال، خاصة في مجموعات البيانات التي تحتوي على بيانات فئوية ورقمية مختلطة. ومع ذلك، تعترف الدراسة ببعض القيود، بما في ذلك الموارد الحاسوبية الأعلى المطلوبة لتدريب CatBoost مقارنة بالنماذج الأخرى وإمكانية أن يقع PSO في الأمثل المحلي، خاصة في الفضاءات عالية الأبعاد. كانت التقييمات مقيدة بمنطقة شبكة استشعار لاسلكية (WSN) مستطيلة تحت توزيع مستشعر موحد، مما يشير إلى أن الأبحاث المستقبلية يمكن أن تستكشف الأداء في تكوينات مختلفة، مثل المناطق الدائرية وتوزيعات المستشعرات المتنوعة. بالإضافة إلى ذلك، يقترح المؤلفون أن العمل المستقبلي يمكن أن يتضمن تقنيات هندسة الميزات وخوارزميات تحسين مدعومة بالبدائل، مثل تحسين بايزي، لتحسين القدرات التنبؤية وتقليل وقت التدريب.
نتائج
في هذه الدراسة، تم استخدام خوارزمية CatBoost، المعززة من خلال نهج تحسين سرب الجسيمات (PSO)، للتنبؤ بعدد الحواجز الأمثل للكشف عن التسلل ومنعه. تم تقييم أداء CatBoost مقابل عدة نماذج متطورة، بما في ذلك LightGBM وXGBoost وRandom Forest (RF) وDecision Trees (DT)، والتي تم تحسينها جميعًا باستخدام PSO لضمان مقارنة عادلة. شمل التحليل تقييم أهمية الميزات عبر جميع النماذج، وتم وضع النتائج في سياق الأدبيات الحالية التي تستخدم نفس مجموعة البيانات.
تم تقسيم مجموعة البيانات إلى مجموعة تدريب (75%) ومجموعة اختبار (25%)، وتم تقييم فعالية النموذج من خلال التحقق المتقاطع بخمسة طيات. تضمنت التصميم التجريبي مرحلتين: المرحلة الأولية استخدمت بحثًا شبكيًا مع تكوينات محدودة، بينما تضمنت المرحلة الثانية تحسينًا شاملًا للمعلمات الفائقة عبر خوارزمية PSO. تم التحقق من قوة نهج PSO من خلال 30 اختبارًا مع بذور متغيرة، مع الالتزام بإعدادات المعلمات المحددة. تم استخدام مقاييس الأداء، بما في ذلك متوسط الخطأ المطلق (MAE) ومتوسط الخطأ التربيعي (MSE) وجذر متوسط الخطأ التربيعي (RMSE) ومعامل التحديد ($R^2$)، لتقييم أداء النماذج على مجموعة الاختبار.
نقاش
في قسم النقاش، يحدد البحث بروتوكولات الاتصال المختلفة المستخدمة في الشبكات اللاسلكية للاستشعار (WSNs)، مع التركيز على تصميمها لمواجهة التحديات مثل موارد الطاقة المحدودة وتغيرات تكوين الشبكة. تشمل البروتوكولات الرئيسية Bluetooth وZigbee وNFC وWi-Fi وSigfox والشبكات الخلوية، كل منها يتميز باستهلاك طاقة محدد، ونطاقات اتصال، وتكوينات. يبرز البحث أهمية تكييف هذه البروتوكولات مع سيناريوهات النشر المحددة لتحسين الأداء، وتخصيص الموارد، والأمان.
تم توليد مجموعة البيانات المستخدمة في الدراسة بشكل اصطناعي باستخدام محاكاة مونت كارلو، وشملت ميزات مثل منطقة الشبكة، ونطاق الاستشعار، ونطاق الإرسال، وعدد عقد المستشعرات. المتغير المستهدف، عدد الحواجز، هو أمر حاسم لتحسين أداء الشبكة. تتكون مجموعة البيانات من 183 مثالًا، مع تحليل إحصائي يشير إلى توزيعات منتظمة للميزات، مما ينفي الحاجة إلى تعديلات على القيم الشاذة. تناقش الورقة أيضًا خوارزميات التعلم الآلي المختلفة، بما في ذلك أشجار القرار، والغابات العشوائية، وXGBoost، وLightGBM، وCatBoost، موضحة نقاط قوتها وضعفها في سياق مهام الانحدار. ومن الجدير بالذكر أن CatBoost تفوقت على النماذج الأخرى من حيث قيم R² والثبات، مما يظهر فعاليتها في تقدير عدد الحواجز في WSNs. تختتم الدراسة بالتأكيد على أهمية تحسين المعلمات الفائقة وتقييم أداء هذه النماذج باستخدام مقاييس مثل MAE وMSE وRMSE وR².
DOI: https://doi.org/10.1007/s13042-025-02654-5
Publication Date: 2025-05-06
Author(s): Kadir İleri
Primary Topic: Energy Efficient Wireless Sensor Networks
Overview
This section discusses the significance of Wireless Sensor Networks (WSNs) in enhancing border security through effective intrusion detection and surveillance. The study introduces a machine learning model that predicts the number of k-barriers necessary for rapid intrusion detection in a rectangular area, utilizing features derived from WSN data via Monte-Carlo simulation. The model employs the CatBoost algorithm, optimized through the Particle Swarm Optimization (PSO) technique.
The performance of the proposed CatBoost-PSO model is rigorously compared to established methods, including LightGBM, XGBoost, Random Forest (RF), and Decision Tree (DT), using evaluation metrics such as Mean Absolute Error (MAE), Mean Squared Error (MSE), Root Mean Squared Error (RMSE), and the coefficient of determination ($R^2$). The results indicate that the CatBoost-PSO model significantly outperforms its counterparts, achieving an $R^2$ of 0.9998, MAE of 0.6298, MSE of 0.6018, and RMSE of 0.7758. Additionally, feature importance analysis identifies the network area and transmission range as critical factors influencing the prediction of k-barriers. Overall, the study concludes that the CatBoost-PSO model represents a highly effective solution for intrusion detection and prevention in WSN applications.
Introduction
The introduction of this research paper emphasizes the critical importance of border security for nations, highlighting the challenges posed by unauthorized entries, including refugee influxes and criminal activities. Traditional methods of border protection, such as military patrols, are limited by the vastness of international boundaries, necessitating the use of advanced technologies for effective monitoring. Wireless Sensor Networks (WSNs) are proposed as a viable solution for intrusion detection due to their rapid deployment, cost-effectiveness, and ability to operate without pre-existing infrastructure. The section reviews various studies that have utilized WSNs for border surveillance, detailing their methodologies, findings, and limitations.
Key contributions from the literature include the development of energy-efficient systems, performance analyses of heterogeneous WSNs, and innovative algorithms for optimizing sensor coverage. Notably, the paper introduces a novel machine learning model that combines the CatBoost algorithm with Particle Swarm Optimization (PSO) to predict the number of k-barriers for enhanced intrusion detection. This model leverages features such as network area, transmission range, sensing range, and sensor count, demonstrating superior performance compared to existing models. The introduction sets the stage for a detailed exploration of communication protocols, datasets, and experimental findings in subsequent sections, underscoring the significance of rapid detection capabilities in border security scenarios.
Methods
In this study, the authors conducted a comprehensive performance comparison of their proposed CatBoost model optimized with Particle Swarm Optimization (PSO) against existing machine learning methods applied to a newly released dataset from January 2022. The results, summarized in Table 10, indicate that the CatBoost-PSO model significantly outperforms other methods in estimating the number of barriers for intrusion detection and prevention, achieving a Mean Absolute Error (MAE) of 0.6298, Mean Squared Error (MSE) of 0.6018, Root Mean Squared Error (RMSE) of 0.7758, and an R² value of 0.9998. In contrast, the Artificial Neural Network (ANN) exhibited the poorest performance with an R² of 0.38, while the Gaussian Process Regression (GPR) model also performed poorly with an MSE of 0.4074 and RMSE of 63.83.
The CatBoost model’s superior performance is attributed to its optimized ordered boosting technique, which enhances the training process and effectively captures relationships between features, particularly in datasets with mixed categorical and numerical data. However, the study acknowledges certain limitations, including the higher computational resources required for training CatBoost compared to other models and the potential for PSO to become trapped in local optima, especially in high-dimensional spaces. The evaluation was restricted to a rectangular wireless sensor network (WSN) region under uniform sensor distribution, suggesting that future research could explore performance in different configurations, such as circular regions and varying sensor distributions. Additionally, the authors propose that future work could incorporate feature engineering techniques and surrogate-assisted optimization algorithms, like Bayesian Optimization, to improve predictive capabilities and reduce training time.
Results
In this study, the CatBoost algorithm, enhanced through a Particle Swarm Optimization (PSO) approach, was utilized to predict the optimal number of barriers for intrusion detection and prevention. The performance of CatBoost was benchmarked against several state-of-the-art models, including LightGBM, XGBoost, Random Forest (RF), and Decision Trees (DT), all of which were similarly optimized using PSO to ensure a fair comparison. The analysis included an evaluation of feature importance across all models, and the results were contextualized against existing literature utilizing the same dataset.
The dataset was partitioned into a training set (75%) and a test set (25%), with model effectiveness assessed through fivefold cross-validation. The experimental design comprised two phases: the initial phase employed a grid search with limited configurations, while the second phase involved comprehensive hyperparameter optimization via the PSO algorithm. The robustness of the PSO approach was validated through 30 tests with varying seeds, adhering to specified parameter settings. Performance metrics, including Mean Absolute Error (MAE), Mean Squared Error (MSE), Root Mean Squared Error (RMSE), and the coefficient of determination ($R^2$), were utilized to evaluate the models’ performance on the test set.
Discussion
In the discussion section, the paper outlines various communication protocols utilized in Wireless Sensor Networks (WSNs), emphasizing their design to tackle challenges such as limited energy resources and dynamic network topologies. Key protocols include Bluetooth, Zigbee, NFC, Wi-Fi, Sigfox, and Cellular Networks, each characterized by specific power consumption, communication ranges, and topologies. The paper highlights the importance of adapting these protocols to specific deployment scenarios to optimize performance, resource allocation, and security.
The dataset employed in the study was synthetically generated using Monte-Carlo simulations, encompassing features such as network area, sensing range, transmission range, and the number of sensor nodes. The target variable, the number of barriers, is crucial for enhancing network performance. The dataset comprises 183 examples, with statistical analysis indicating regular distributions of features, thus negating the need for outlier adjustments. The paper also discusses various machine learning algorithms, including Decision Trees, Random Forests, XGBoost, LightGBM, and CatBoost, detailing their strengths and weaknesses in the context of regression tasks. Notably, CatBoost outperformed other models in terms of R² values and stability, demonstrating its effectiveness in estimating the number of barriers in WSNs. The study concludes by emphasizing the significance of hyperparameter optimization and the performance evaluation of these models using metrics such as MAE, MSE, RMSE, and R².
