DOI: https://doi.org/10.14569/ijacsa.2025.0160386
تاريخ النشر: 2025-01-01
المؤلف: S. Balakrishnan وآخرون
الموضوع الرئيسي: طرق التنبؤ بسوق الأسهم
نظرة عامة
تقدم ورقة البحث نهجًا جديدًا للتنبؤ المالي يدمج خوارزميات قائمة على السرب مع هياكل التعلم العميق لتعزيز دقة التنبؤ في البيانات المالية المعقدة وعالية الأبعاد. النماذج التقليدية، مثل الشبكات العصبية التلافيفية (CNN)، والشبكات العصبية المتكررة (RNN)، وآلات تعزيز التدرج (GBM)، على الرغم من فعاليتها، إلا أن لديها قيودًا في الكفاءة. تستخدم الطريقة المقترحة تقنيات معالجة بيانات متقدمة لتحسين عملية التعلم وتقليل الإفراط في التكيف. تظهر النتائج التجريبية أن النموذج المحسن حقق دقة مثيرة للإعجاب تبلغ 98%، متجاوزًا بشكل كبير أداء CNN (80%)، RNN (83%)، وGBM (95.6%). كما أظهر النموذج توازنًا جيدًا بين الدقة والاسترجاع، مما يجعله مناسبًا للتطبيقات الواقعية مثل التنبؤ بأسعار الأسهم وتحليل اتجاهات السوق.
في الخاتمة، تؤكد الدراسة على الأداء المتفوق للطريقة المقترحة عبر مؤشرات التقييم الرئيسية، مما يشير إلى موثوقيتها للتطبيقات العملية التي تتطلب دقة عالية. تؤكد النتائج على أهمية نهج محسن لتحقيق توازن فعال بين الدقة والاسترجاع. تشمل اتجاهات البحث المستقبلية استكشاف نماذج قائمة على التعلم المعزز لتعزيز القدرة على التكيف في ظروف السوق المتغيرة، بالإضافة إلى التحقيق في الهياكل الهجينة التي تستفيد من نقاط القوة في النماذج الحالية. بالإضافة إلى ذلك، يُقترح دمج تقنيات مثل التعلم الانتقالي وتقليص النموذج لتحسين الكفاءة وقابلية التوسع للتطبيقات في الوقت الحقيقي. يدعو المؤلفون إلى إجراء اختبارات شاملة على مجموعات بيانات أكبر ومتنوعة للتحقق من قوة النموذج وتوسيع نطاق تطبيقه في التحديات المالية الواقعية.
مقدمة
تؤكد مقدمة ورقة البحث هذه على الأهمية الحاسمة للتنبؤ المالي عبر مجالات متنوعة، بما في ذلك التنبؤ بسوق الأسهم وإدارة المخاطر. غالبًا ما تكافح نماذج التنبؤ التقليدية لالتقاط التعقيدات واللاخطية المتأصلة في البيانات المالية، مما يؤدي إلى توقعات دون المستوى بسبب اعتمادها على افتراضات خطية. الطبيعة غير القابلة للتنبؤ للأسواق المالية، التي تتفاقم بفعل التأثيرات الخارجية مثل الأحداث السياسية ومشاعر السوق، تتطلب تطوير نماذج أكثر تعقيدًا قادرة على التكيف مع هذه الديناميكيات.
لمعالجة هذه التحديات، تقترح الورقة إطارًا جديدًا يدمج نماذج التعلم العميق مع تقنيات تحسين الذكاء السرب، وتحديدًا تحسين سرب الجسيمات (PSO) وتحسين مستعمرة النمل (ACO). يهدف هذا النهج الهجين إلى تعزيز دقة التنبؤات المالية من خلال تحسين المعلمات الفائقة الرئيسية لنماذج التعلم العميق، مما يحسن قدرتها على تعلم الأنماط المعقدة في البيانات عالية الأبعاد. تنوي الدراسة مقارنة أداء هذه النماذج المعززة بالسرب ضد طرق التنبؤ التقليدية مثل ARIMA، مع تسليط الضوء على مزايا الذكاء السرب في تحقيق توقعات قوية وفعالة. تشمل المساهمات الرئيسية تطوير نموذج هجين محسن، والتحقق الواسع عبر مجموعات بيانات مالية متنوعة، ورؤى حول قابلية التوسع وتطبيق تقنيات التحسين المتقدمة في التنبؤ المالي.
طرق
تدمج المنهجية المقترحة لتعزيز التنبؤ المالي الشبكات العصبية طويلة وقصيرة المدى (LSTM) مع تحسين سرب الجسيمات (PSO). في البداية، يتم تجميع مجموعات بيانات مالية متنوعة، بما في ذلك أسعار الأسهم التاريخية، وأسعار السلع، وأحجام التداول، ومؤشرات اقتصادية (مثل أسعار الفائدة، ونمو الناتج المحلي الإجمالي) من كاجل. تخضع البيانات لعمليات معالجة مسبقة لمعالجة القيم المفقودة، والقيم الشاذة، والتطبيع من خلال مقياس الحد الأدنى والحد الأقصى. يتم تنظيم بيانات السلاسل الزمنية في تسلسلات، ويتم هندسة المؤشرات الفنية لالتقاط ديناميكيات السوق، مثل المتوسطات المتحركة ومؤشرات التقلب، مما يعد مجموعة البيانات لتدريب LSTM.
نموذج LSTM بارع في التعرف على الاعتماديات طويلة المدى والأنماط الزمنية في البيانات المالية، مما يمكّنه من التنبؤ بسلوكيات السوق المعقدة. يتم استخدام PSO لتحسين أداء النموذج من خلال ضبط المعلمات الفائقة، بما في ذلك معدل التعلم، وحجم الدفعة، وعدد طبقات LSTM. في هذه العملية، تمثل الجسيمات مجموعات مختلفة من المعلمات الفائقة، ويتم تقييم لياقتها باستخدام متوسط الخطأ التربيعي. تستمر عملية تحديث مواقع وسرعات الجسيمات بشكل تكراري حتى يتم استيفاء معايير التقارب، مما يؤدي إلى اختيار المعلمات الفائقة المثلى. يتم بعد ذلك إعادة تدريب نموذج LSTM المصقول على مجموعة البيانات الكاملة، مما يسهل التنبؤ الدقيق بأسعار الأسهم واتجاهات السوق. يعالج هذا النهج الهجين بفعالية الضوضاء واللاخطية المتأصلة في البيانات المالية، مما يعزز موثوقية التنبؤات لاتخاذ القرارات المالية.
نتائج
تظهر نتائج عملية التحسين فعالية تحسين سرب الجسيمات (PSO) في تعزيز قيم دالة اللياقة لنموذج الشبكة العصبية طويلة وقصيرة المدى (LSTM) على مدى ستة أشهر. في البداية، تم تسجيل قيمة اللياقة عند 0.5 في ديسمبر، والتي زادت إلى ذروتها عند 0.9 بحلول يونيو، مما يشير إلى عملية ضبط معلمات ناجحة. توضح التقلبات في قيم اللياقة على مدار الأشهر الطبيعة الديناميكية للتحسين، مع فترات من الاستقرار والتحسن، مما يؤكد ملاءمة PSO لتحسين نماذج LSTM.
توضح الأشكال المقدمة في الدراسة أداء النموذج بشكل أكبر. الشكل 4 يظهر خسارة التدريب والتحقق على مدى 25 حقبة، حيث انخفضت خسارة التدريب من 0.25 إلى 0.0015 وانخفضت خسارة التحقق من 0.22 إلى 0.0115، مما يشير إلى تعلم فعال وتعميم. الشكل 5 يبرز دقة التدريب والتحقق، حيث وصلت دقة التدريب إلى ما يقرب من 0.999 وزادت دقة التحقق إلى 0.995، مما يشير إلى قدرات تعميم قوية دون إفراط كبير في التكيف. بالإضافة إلى ذلك، الشكل 8 يوضح حساسية دقة النموذج للتغيرات في معدل التعلم، بينما الشكل 9 يقدم توزيع قيم الخطأ، مما يساعد في فهم سلوك الخطأ عبر نطاقات مختلفة. أخيرًا، الشكل 10 يمثل بصريًا تقارب PSO لنموذج LSTM، متتبعًا تحسين قيم دالة اللياقة من ديسمبر إلى يونيو.
مناقشة
تسلط المناقشة الضوء على قيود نماذج التنبؤ المالي التقليدية، مثل ARIMA وGARCH، التي تعتمد على افتراضات خطية وتكافح لالتقاط العلاقات المعقدة وغير الخطية المتأصلة في البيانات المالية. بينما أظهرت تقنيات التعلم الآلي مثل أشجار القرار (DT)، وآلات الدعم الشعاعي (SVM)، والغابات العشوائية (RF) تحسينات في التعامل مع اللاخطية، إلا أنها لا تزال تواجه تحديات تتعلق بتحسين المعلمات الفائقة والإفراط في التكيف. لقد قدم ظهور التعلم العميق، وخاصة الشبكات العصبية طويلة وقصيرة المدى (LSTM)، طريقًا واعدًا لالتقاط الاعتماديات طويلة المدى في بيانات السلاسل الزمنية المالية. ومع ذلك، لا يزال تحسين المعلمات الفائقة في هذه النماذج عقبة كبيرة، مما يستدعي استكشاف تقنيات الذكاء السرب، مثل تحسين سرب الجسيمات (PSO)، لتعزيز أداء النموذج.
تظهر الطريقة المقترحة، التي تدمج LSTM مع PSO لضبط المعلمات الفائقة، أداءً متفوقًا عبر مؤشرات رئيسية، حيث تحقق دقة تبلغ 98%، ودقة تبلغ 96.7%، واسترجاع يبلغ 95.9%. تؤكد هذه الأداء القوي قدرة النموذج على تحقيق توازن فعال بين الدقة والاسترجاع، مما يجعله مناسبًا لتطبيقات التنبؤ المالي في العالم الحقيقي. بالمقابل، تظهر النماذج التقليدية مثل آلة تعزيز التدرج (GBM) والشبكات العصبية المتكررة (RNN) قيودًا في مؤشرات معينة، لا سيما في الاسترجاع ودرجة F1. تشير النتائج إلى أن الإطار المعزز بالسرب المقترح يقلل بشكل كبير من أخطاء التنبؤ في بيئات مالية متقلبة، مما يمهد الطريق للبحوث المستقبلية لاستكشاف التعلم المعزز والنماذج الهجينة لتعزيز القدرة على التكيف والكفاءة في التنبؤ المالي.
DOI: https://doi.org/10.14569/ijacsa.2025.0160386
Publication Date: 2025-01-01
Author(s): S. Balakrishnan et al.
Primary Topic: Stock Market Forecasting Methods
Overview
The research paper presents a novel approach to financial forecasting that integrates swarm-based algorithms with deep learning architectures to enhance predictive accuracy in complex, high-dimensional financial data. Traditional models, such as Convolutional Neural Networks (CNN), Recurrent Neural Networks (RNN), and Gradient Boosting Machines (GBM), while effective, have limitations in efficiency. The proposed method employs elite data preprocessing techniques to optimize the learning process and mitigate overfitting. Experimental results demonstrate that the optimized model achieved an impressive accuracy of 98%, significantly surpassing the performance of CNN (80%), RNN (83%), and GBM (95.6%). The model also exhibited a favorable precision-recall tradeoff, making it suitable for real-world applications like stock price prediction and market trend analysis.
In the conclusion, the study emphasizes the superior performance of the proposed method across key evaluation metrics, indicating its reliability for practical applications requiring high accuracy. The findings underscore the importance of an optimized approach to balance precision and recall effectively. Future research directions include exploring reinforcement learning-based models to enhance adaptability in varying market conditions, as well as investigating hybrid architectures that leverage the strengths of existing models. Additionally, the incorporation of techniques such as transfer learning and model pruning is suggested to improve efficiency and scalability for real-time applications. The authors advocate for extensive testing on larger, diverse datasets to validate the model’s robustness and broaden its applicability in real-world financial challenges.
Introduction
The introduction of this research paper emphasizes the critical importance of financial forecasting across various domains, including stock market prediction and risk management. Traditional forecasting models often struggle to capture the complexities and nonlinearities inherent in financial data, leading to suboptimal predictions due to their reliance on linear assumptions. The unpredictable nature of financial markets, compounded by external influences such as political events and market sentiment, necessitates the development of more sophisticated models capable of adapting to these dynamics.
To address these challenges, the paper proposes a novel framework that integrates deep learning models with swarm intelligence optimization techniques, specifically Particle Swarm Optimization (PSO) and Ant Colony Optimization (ACO). This hybrid approach aims to enhance the accuracy of financial forecasts by optimizing key hyperparameters of deep learning models, thereby improving their ability to learn complex patterns in high-dimensional data. The research intends to compare the performance of these swarm-optimized deep learning models against traditional forecasting methods like ARIMA, highlighting the advantages of swarm intelligence in achieving robust and efficient predictions. Key contributions include the development of an optimized hybrid model, extensive validation across diverse financial datasets, and insights into the scalability and applicability of advanced optimization techniques in financial forecasting.
Methods
The proposed methodology for enhancing financial forecasting integrates Long Short-Term Memory (LSTM) networks with Particle Swarm Optimization (PSO). Initially, diverse financial datasets, including historical stock prices, commodity prices, trading volumes, and economic indicators (e.g., interest rates, GDP growth), are aggregated from Kaggle. The data undergoes preprocessing to address missing values, outliers, and normalization through min-max scaling. Time-series data is organized into sequences, and technical indicators are engineered to capture market dynamics, such as moving averages and volatility indices, preparing the dataset for LSTM training.
The LSTM model is adept at recognizing long-term dependencies and temporal patterns in financial data, enabling it to predict complex market behaviors. PSO is employed to optimize model performance by fine-tuning hyperparameters, including learning rate, batch size, and the number of LSTM layers. In this optimization process, particles represent various hyperparameter combinations, with their fitness assessed using Mean Squared Error. The iterative updating of particle positions and velocities continues until convergence criteria are satisfied, leading to the selection of optimal hyperparameters. The refined LSTM model is subsequently retrained on the complete dataset, facilitating accurate forecasting of stock prices and market trends. This hybrid approach effectively addresses the inherent noise and nonlinearity of financial data, thereby enhancing the reliability of predictions for financial decision-making.
Results
The results of the optimization process demonstrate the effectiveness of Particle Swarm Optimization (PSO) in enhancing the fitness function values of the Long Short-Term Memory (LSTM) model over a six-month period. Initially, the fitness value was recorded at 0.5 in December, which increased to a peak of 0.9 by June, indicating a successful parameter tuning process. The fluctuations in fitness values throughout the months illustrate the dynamic nature of the optimization, with periods of both stability and improvement, thereby confirming PSO’s suitability for optimizing LSTM models.
Figures presented in the study further elucidate the model’s performance. Figure 4 shows the training and validation loss over 25 epochs, with training loss decreasing from 0.25 to 0.0015 and validation loss dropping from 0.22 to 0.0115, indicating effective learning and generalization. Figure 5 highlights the training and validation accuracy, with training accuracy reaching near 0.999 and validation accuracy increasing to 0.995, suggesting strong generalization capabilities without significant overfitting. Additionally, Figure 8 illustrates the sensitivity of model accuracy to changes in the learning rate, while Figure 9 presents the distribution of error values, aiding in understanding error behavior across different ranges. Lastly, Figure 10 visually represents the convergence of PSO for the LSTM model, tracking the improvement in fitness function values from December to June.
Discussion
The discussion highlights the limitations of traditional financial forecasting models, such as ARIMA and GARCH, which rely on linear assumptions and struggle to capture the complex, non-linear relationships inherent in financial data. While machine learning techniques like Decision Trees (DT), Support Vector Machines (SVM), and Random Forests (RF) have shown improvements in handling non-linearities, they still face challenges related to hyperparameter optimization and overfitting. The emergence of deep learning, particularly Long Short-Term Memory (LSTM) networks, has provided a promising avenue for capturing long-term dependencies in financial time series data. However, the optimization of hyperparameters in these models remains a significant hurdle, necessitating the exploration of swarm intelligence techniques, such as Particle Swarm Optimization (PSO), to enhance model performance.
The proposed method, which integrates LSTM with PSO for hyperparameter tuning, demonstrates superior performance across key metrics, achieving an accuracy of 98%, precision of 96.7%, and recall of 95.9%. This robust performance underscores the model’s ability to balance precision and recall effectively, making it suitable for real-world financial forecasting applications. In contrast, traditional models like Gradient Boosting Machine (GBM) and Recurrent Neural Networks (RNN) exhibit limitations in specific metrics, particularly in recall and F1-score. The findings suggest that the proposed swarm-optimized deep learning framework significantly reduces prediction errors in volatile financial environments, paving the way for future research to explore reinforcement learning and hybrid models to further enhance adaptability and efficiency in financial forecasting.
