نهج الشبكة العصبية العميقة المدمج مع التعلم المعزز لتوقع أسعار الصرف باستخدام بيانات السلاسل الزمنية والعوامل المؤثرة
Deep neural network approach integrated with reinforcement learning for forecasting exchange rates using time series data and influential factors

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-12516-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40781102
تاريخ النشر: 2025-08-08
المؤلف: T. Soni Madhulatha وآخرون
الموضوع الرئيسي: طرق التنبؤ بسوق الأسهم

نظرة عامة

تقدم الدراسة بنية هجينة جديدة تجمع بين شبكات الذاكرة طويلة وقصيرة المدى (LSTM) وعوامل الشبكة العميقة Q (DQN) لتوقع أسعار الصرف، مع التركيز بشكل خاص على مجموعة بيانات USD/INR. تعزز هذه الطريقة النماذج التقليدية من خلال دمج التعلم المعزز، مما يسمح للنظام بالتعلم التكيفي من التغذية الراجعة وتحسين دقة التنبؤ، كما تقاس بواسطة مقاييس مثل متوسط الخطأ التربيعي (MSE) وجذر متوسط الخطأ التربيعي (RMSE). تشير النتائج إلى أن هذه الإطار لديه إمكانات كبيرة للتطبيقات في التداول وإدارة المخاطر والتخطيط المالي.

يتم اقتراح عمل مستقبلي لمعالجة التعقيد الحسابي لنموذج LSTM-DQN، مما يمكّن من تحسين قابلية التوسع لمجموعات البيانات الكبيرة والتطبيقات في الوقت الحقيقي. يمكن أن تشمل التحسينات دمج مصادر بيانات إضافية، مثل المؤشرات الاقتصادية وتحليل المشاعر من الأخبار المالية، لتحسين استجابة النموذج لتغيرات السوق. كما يقترح المؤلفون استكشاف تقنيات التعلم المعزز المتقدمة وتوسيع النموذج لتوقعات متعددة العملات باستخدام أساليب قائمة على الرسوم البيانية. علاوة على ذلك، يؤكدون على الحاجة إلى تقييم شامل لأداء النموذج من خلال مقاييس إضافية تتجاوز MSE وRMSE، مثل متوسط الخطأ النسبي المطلق (MAPE) ومقاييس الدقة الاتجاهية، لتوفير معلومات أفضل لصنع القرار المالي. أخيرًا، يتم تسليط الضوء على تنفيذ النموذج في بيئة تداول حية كخطوة حاسمة لتقييم قابليته للتكيف وكفاءة التنفيذ في سيناريوهات الوقت الحقيقي.

الطرق

تقيم قسم النتائج التجريبية أداء نموذج LSTM-DQN المقترح على مجموعة بيانات من أسعار صرف USD/INR جنبًا إلى جنب مع مؤشرات اقتصادية رئيسية مثل الذهب والنفط الخام ومعدلات التضخم. خضعت مجموعة البيانات لعمليات معالجة مسبقة وتطبيع قبل إدخالها في النموذج. تم تقييم نموذج LSTM-DQN مقابل عدة نماذج متطورة، بما في ذلك نموذج LSTM القائم على دمج متعدد الوسائط (MF-LSTM)، AB-LSTM-GRU، TSMixer، نماذج LSTM الهجينة، ونموذج LSTM المكدس ذو الطبقتين (TLS-LSTM). بينما توفر هذه النماذج قواعد قوية، أظهر نموذج LSTM-DQN دقة وقوة تفوق، محققًا دقة تصنيف بنسبة 100% دون أي إيجابيات أو سلبيات كاذبة في توقع فئات أسعار الصرف.

كشفت التحليلات عن وجود ارتباطات كبيرة بين سعر صرف USD/INR والمؤشرات الاقتصادية، لا سيما أسعار الذهب والنفط الخام، على الرغم من أن هذه العلاقات لم تكن خطية بشكل صارم. تم استخدام تحليلات إحصائية، بما في ذلك السلاسل الزمنية، والارتباط، والانحدار، لاستكشاف هذه التعقيدات. حقق نموذج LSTM-DQN معامل ارتباط قدره 0.9942 بين القيم الفعلية والمتوقعة، مما يشير إلى ملاءمة قوية للتنبؤ. أظهرت مقاييس الأداء مثل متوسط الخطأ التربيعي (MSE)، ومتوسط الخطأ المطلق (MAE)، وجذر متوسط الخطأ التربيعي (RMSE) أن نموذج LSTM-DQN تفوق على النماذج الأخرى، بما في ذلك CNN وGRU، بأدنى قيم خطأ (MSE = 0.37، MAE = 0.46، RMSE = 0.61). أكدت اختبارات الدلالة الإحصائية أن التحسينات التي قدمها نموذج LSTM-DQN مقارنة بالنماذج الأساسية كانت ذات دلالة (p < 0.05)، مما يبرز فعاليته في التقاط الاعتماديات المعقدة وغير الخطية في أسواق العملات الديناميكية.

المناقشة

يوفر قسم المناقشة في ورقة البحث نظرة شاملة على التقدم في تقنيات التعلم العميق والتعلم الآلي لتوقع السلاسل الزمنية المالية، مع التركيز بشكل خاص على توقع أسعار الصرف. يسلط الضوء على منهجيات متنوعة، بما في ذلك النماذج المستقلة والهجينة، ويحدد فجوات بحثية كبيرة، لا سيما الحاجة إلى أطر متكاملة تعزز دقة التنبؤ أثناء دمج آليات اتخاذ القرار التكيفية. تشير الأدبيات إلى أنه بينما تتفوق نماذج مثل الذاكرة طويلة وقصيرة المدى (LSTM) ووحدة التكرار المغلقة (GRU) في التقاط الاعتماديات الزمنية، فإنها غالبًا ما تفتقر إلى قدرات التعلم المعزز، والتي تعتبر حاسمة للتكيف مع الطبيعة الديناميكية للأسواق المالية.

يتناول القسم أيضًا أداء مختلف الهياكل المعمارية للتعلم العميق، مثل CNN وGRU والنماذج الهجينة، مع التركيز على نقاط قوتها وقيودها. من الجدير بالذكر أنه بينما تظهر نماذج مثل BiLSTM دقة محسنة، فإنها تقدم أيضًا تعقيدات يمكن أن تعيق كفاءة التدريب. تؤكد المناقشة على أهمية تطوير نماذج لا تتنبأ بدقة فحسب، بل تتكيف أيضًا مع تغيرات السوق في الوقت الحقيقي من خلال التعلم المعزز، مما يعزز عمليات اتخاذ القرار. تهدف الإطار الهجين المقترح، الذي يدمج شبكات LSTM مع وكيل DQN، إلى معالجة هذه الفجوات من خلال تحسين التنبؤات بشكل تكراري والتكيف مع ظروف السوق الجديدة، وبالتالي تلبية حاجة حاسمة في التنبؤ المالي.

القيود

تقدم الدراسة ثلاث قيود كبيرة تتعلق بنموذج LSTM-DQN المقترح. أولاً، بينما يظهر النموذج أداءً متفوقًا، فإنه يتحمل تعقيدًا حسابيًا عاليًا بسبب دمج التعلم المعزز، مما يؤدي إلى زيادة وقت التدريب والتكاليف. ثانيًا، تستند الدراسة فقط إلى مجموعة بيانات واحدة (أسعار صرف USD/INR) واختيار محدود من المؤشرات الاقتصادية، مما قد يقيد قابلية تطبيق النتائج على أزواج عملات أخرى أو سياقات مالية متنوعة. أخيرًا، فإن الاعتماد على دالة مكافأة مستقرة ضمن إطار التعلم المعزز يطرح تحديات، لا سيما في ظروف السوق غير الطبيعية حيث قد لا تمثل المكافآت النتائج المتوقعة بدقة.

بالإضافة إلى ذلك، تسلط الدراسة الضوء على الحاجة إلى بيانات تدريب كافية، والعبء الحسابي للتحديثات في الوقت الحقيقي، وجودة الميزات الاقتصادية الكلية. كما تقترح أن يتم تقييم النموذج في ظل ظروف صدمات سوق أقل تكرارًا. للتخفيف من الإفراط في التكيف، تم استخدام تقنيات مثل التوقف المبكر، والانقطاع، وتقسيم التحقق. ستركز الأبحاث المستقبلية على تعزيز التعميم عبر مجالات مختلفة وتطوير استراتيجيات نشر قابلة للتوسع، بهدف معالجة هذه القيود وتحسين قوة وملاءمة المنهجية المقترحة.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-12516-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40781102
Publication Date: 2025-08-08
Author(s): T. Soni Madhulatha et al.
Primary Topic: Stock Market Forecasting Methods

Overview

The research presents a novel hybrid architecture combining Long Short-Term Memory (LSTM) networks and Deep Q-Network (DQN) agents for forecasting exchange rates, specifically targeting the USD/INR dataset. This approach enhances traditional models by integrating reinforcement learning, allowing the system to adaptively learn from feedback and improve prediction accuracy, as measured by metrics such as Mean Squared Error (MSE) and Root Mean Squared Error (RMSE). The findings suggest that this framework has significant potential for applications in trading, risk management, and financial planning.

Future work is proposed to address the computational complexity of the LSTM-DQN model, enabling better scalability for large datasets and real-time applications. Enhancements could include incorporating additional data sources, such as economic indicators and sentiment analysis from financial news, to improve the model’s responsiveness to market changes. The authors also suggest exploring advanced reinforcement learning techniques and extending the model to multi-currency predictions using graph-based approaches. Furthermore, they emphasize the need for a comprehensive evaluation of model performance through additional metrics beyond MSE and RMSE, such as Mean Absolute Percentage Error (MAPE) and directional accuracy measures, to better inform financial decision-making. Finally, implementing the model in a live trading environment is highlighted as a critical next step to assess its adaptability and execution efficiency in real-time scenarios.

Methods

The experimental results section assesses the performance of the proposed LSTM-DQN model on a dataset of USD/INR exchange rates alongside key economic indicators such as gold, crude oil, and inflation rates. The dataset underwent pre-processing and normalization prior to model input. The LSTM-DQN model was benchmarked against several state-of-the-art models, including Multimodal Fusion-Based LSTM (MF-LSTM), AB-LSTM-GRU, TSMixer, Hybrid LSTM Models, and Two-Layer Stacked LSTM (TLS-LSTM). While these models provide robust baselines, the LSTM-DQN model demonstrated superior accuracy and robustness, achieving a classification accuracy of 100% with no false positives or negatives in predicting exchange rate categories.

The analysis revealed significant correlations between the USD/INR exchange rate and economic indicators, particularly gold and crude oil prices, although these relationships were not strictly linear. Statistical analyses, including time series, correlation, and regression, were employed to explore these complexities. The LSTM-DQN model achieved a correlation coefficient of 0.9942 between actual and predicted values, indicating a strong fit for forecasting. Performance metrics such as Mean Squared Error (MSE), Mean Absolute Error (MAE), and Root Mean Squared Error (RMSE) showed that the LSTM-DQN model outperformed other models, including CNN and GRU, with the lowest error values (MSE = 0.37, MAE = 0.46, RMSE = 0.61). Statistical significance tests confirmed that the improvements offered by the LSTM-DQN model over baseline models were significant (p < 0.05), underscoring its effectiveness in capturing complex, non-linear dependencies in dynamic currency markets.

Discussion

The discussion section of the research paper provides a comprehensive overview of advancements in deep learning and machine learning techniques for financial time-series forecasting, particularly focusing on exchange rate prediction. It highlights various methodologies, including standalone and hybrid models, and identifies significant research gaps, particularly the need for integrated frameworks that enhance predictive accuracy while incorporating adaptive decision-making mechanisms. The literature indicates that while models like Long Short-Term Memory (LSTM) and Gated Recurrent Unit (GRU) excel in capturing temporal dependencies, they often lack reinforcement learning capabilities, which are crucial for adapting to the dynamic nature of financial markets.

The section further elaborates on the performance of various deep learning architectures, such as CNN, GRU, and hybrid models, emphasizing their strengths and limitations. Notably, while models like BiLSTM show improved accuracy, they also introduce complexities that can hinder training efficiency. The discussion underscores the importance of developing models that not only predict accurately but also adapt to real-time market changes through reinforcement learning, thereby enhancing decision-making processes. The proposed hybrid framework, which integrates LSTM networks with a Deep Q-Network (DQN) agent, aims to address these gaps by optimizing predictions iteratively and adapting to new market conditions, thus fulfilling a critical need in financial forecasting.

Limitations

The study presents three significant limitations regarding the proposed LSTM-DQN model. Firstly, while the model demonstrates superior performance, it incurs high computational complexity due to the integration of reinforcement learning, leading to increased training time and costs. Secondly, the research is based solely on a single dataset (USD/INR exchange rates) and a limited selection of economic indicators, which may restrict the applicability of the findings to other currency pairs or diverse financial contexts. Lastly, the reliance on a stable reward function within the reinforcement learning framework poses challenges, particularly in abnormal market conditions where rewards may not accurately represent expected outcomes.

Additionally, the study highlights the need for sufficient training data, the computational burden of real-time updates, and the quality of macroeconomic features. It also suggests that the model should be evaluated under conditions of less frequent market shocks. To mitigate overfitting, techniques such as early stopping, dropout, and validation splits were employed. Future research will focus on enhancing generalization across different domains and developing scalable deployment strategies, aiming to address these limitations and improve the robustness and applicability of the proposed methodology.