DOI: https://doi.org/10.1007/s10462-024-10790-7
تاريخ النشر: 2024-06-11
المؤلف: Erol Eğrioğlu وآخرون
الموضوع الرئيسي: طرق التنبؤ بسوق الأسهم
نظرة عامة
يتناول قسم ورقة البحث التقدم في منهجيات التنبؤ، مع تسليط الضوء بشكل خاص على فعالية الشبكات العصبية الاصطناعية العميقة (DNNs) مقارنةً بتقنيات التنبؤ التقليدية. بينما تستخدم DNNs الكلاسيكية عادةً وظائف تجميع إضافية، يشير المؤلفون إلى أن الشبكات العصبية الاصطناعية الضحلة التي تستخدم وظائف تجميع مضاعفة قد أظهرت نتائج واعدة. يركزون بشكل خاص على نموذج الخلايا العصبية الشجرية، وهو نوع من الشبكات الضحلة عالية الترتيب المعروفة بقدراتها الفعالة في التنبؤ.
في هذه الدراسة، يقترح المؤلفون بنية جديدة متعددة المخرجات تعتمد على نموذج الخلايا العصبية الشجرية، مما يؤدي إلى شبكة عصبية اصطناعية عميقة جديدة (DANN). يتم تنفيذ تدريب هذه DANN باستخدام خوارزمية التطور التفاضلي. يتم تقييم أداء الشبكة العصبية الاصطناعية الشجرية العميقة بدقة مقارنةً بأساليب التنبؤ الكلاسيكية القياسية وكلا من الشبكات الاصطناعية الضحلة والعميقة، خاصة في سياق سلسلة زمنية لسوق الأسهم. تشير النتائج إلى أن الشبكة العصبية الاصطناعية الشجرية العميقة تتفوق بشكل كبير على نظرائها، مما يظهر إمكانياتها كحل قوي لتحديات التنبؤ.
مقدمة
تتناول مقدمة الورقة التحديات المتعلقة بتنبؤ السلاسل الزمنية، مع التأكيد على دور النماذج الإحصائية في تفسير الحركات السابقة لبيانات السلاسل الزمنية. غالبًا ما تعتمد طرق التنبؤ التقليدية على النماذج الخطية، بينما ظهرت الشبكات العصبية الاصطناعية (ANNs)، وخاصة الشبكات متعددة الطبقات (MLPs)، كأدوات فعالة بسبب قدرتها على استخدام وظائف غير خطية مرنة ومتغيرات متأخرة. تسلط الأدبيات الضوء على تطبيقات متنوعة لـ MLPs عبر مجالات مختلفة، بما في ذلك التعليم، وعلوم البيئة، والتشخيص الطبي، مما يظهر تعدد استخداماتها وفعاليتها.
تناقش الورقة أيضًا تطور هياكل الشبكات العصبية، وخاصة تلك التي تستخدم وظائف تجميع مضاعفة، مثل نماذج Sigma-Pi ونماذج الخلايا العصبية الشجرية. لقد أظهرت هذه النماذج وعدًا في تعزيز دقة التنبؤ من خلال خوارزميات تدريب مبتكرة وتقنيات تحسين. الدافع للدراسة الحالية هو اقتراح شبكة عصبية اصطناعية عميقة متكررة جديدة، تُسمى DeepDenT، والتي تتضمن هيكل “خلية شجرية” جديدة مصممة لتحسين قدرات التنبؤ. تهدف هذه البنية إلى دمج مزايا كل من أساليب التعلم الضحل والعميق، ومعالجة القضايا الشائعة مثل الأمثل المحلية والتجاوز من خلال طريقة تحسين التطور التفاضلي. ستفصل الأقسام اللاحقة من الورقة النماذج المقترحة وتطبيقاتها، خاصة في تنبؤ السلاسل الزمنية لسوق الأسهم.
نقاش
في هذا القسم، يناقش المؤلفون تطوير وبنية نموذج الشبكة العصبية متعددة الخلايا الشجرية (MDNM)، والتي توسع الشبكة العصبية الاصطناعية DNM-ANN الأصلية المقترحة من قبل Todo وآخرين (2014) إلى بنية متعددة المخرجات. يسمح هذا التعديل بوجود هيكل خلية أكثر تعقيدًا داخل الشبكات العصبية العميقة، مما يمكّن من توليد مخرجات متعددة من مجموعة إدخال واحدة. يوضح القسم الصيغ الرياضية لحساب مخرجات الشبكة، بما في ذلك الوظائف المشبكية، والشجرية، والغشائية، بالإضافة إلى المخرج الكلي، مع التأكيد على أهمية معلمات وظيفة التنشيط في إنتاج مخرجات متنوعة. يتم تحديد العدد الإجمالي للمعلمات في MDNM على أنه \(2pm + 2n + 1\)، حيث يمثل \(p\) عدد المدخلات، و\(m\) عدد الشجرات، و\(n\) عدد المخرجات.
علاوة على ذلك، يقدم المؤلفون هيكل خلية الشجرة (DnC)، الذي يعمل بشكل مشابه لخلايا LSTM وGRU، مما يسمح بوجود مدخلات ومخرجات متعددة. يتم أيضًا تقديم بنية الشبكة العصبية الاصطناعية العميقة DeepDenT، التي تتضمن DnCs. تم تصميم هذه الشبكة لتنبؤ السلاسل الزمنية، باستخدام هيكل متصل جزئيًا مع معلمات مشتركة عبر الطبقات المخفية لتحسين الأداء. تعتمد خوارزمية تدريب DeepDenT على تحسين التطور التفاضلي، مع تضمين استراتيجيات للتوقف المبكر وإعادة تعيين المعلمات لتعزيز فعالية التدريب. يذكر المؤلفون أن DeepDenT تظهر أداءً متفوقًا في التنبؤ مقارنةً بالطرق المعتمدة، خاصة في توقع مؤشرات سوق الأسهم، مما يبرز إمكانياتها للتطبيقات المستقبلية في أنظمة التنبؤ الآلي.
DOI: https://doi.org/10.1007/s10462-024-10790-7
Publication Date: 2024-06-11
Author(s): Erol Eğrioğlu et al.
Primary Topic: Stock Market Forecasting Methods
Overview
The research paper section discusses the advancements in forecasting methodologies, particularly highlighting the efficacy of deep artificial neural networks (DNNs) compared to traditional forecasting techniques. While classical DNNs typically employ additive aggregation functions, the authors note that shallow artificial neural networks utilizing multiplicative aggregation functions have demonstrated promising results. Specifically, they focus on the dendritic neuron model, a type of high-order shallow network known for its effective forecasting capabilities.
In this study, the authors propose a novel multi-output architecture based on the dendritic neuron model, resulting in a new deep artificial neural network (DANN). The training of this DANN is executed using the differential evolution algorithm. The performance of the deep dendritic artificial neural network is rigorously evaluated against standard classical forecasting methods and both shallow and deep artificial networks, particularly in the context of stock market time series. The findings indicate that the deep dendritic artificial neural network significantly outperforms its counterparts, showcasing its potential as a robust solution for forecasting challenges.
Introduction
The introduction of the paper addresses the challenges of time series forecasting, emphasizing the role of statistical models in explaining past movements of time series data. Traditional forecasting methods often rely on linear models, while artificial neural networks (ANNs), particularly multilayer perceptrons (MLPs), have emerged as effective tools due to their ability to utilize flexible nonlinear functions and lagged variables. The literature highlights various applications of MLPs across diverse fields, including education, environmental science, and medical diagnostics, showcasing their versatility and effectiveness.
The paper also discusses the evolution of neural network architectures, particularly those utilizing multiplicative aggregation functions, such as the Sigma-Pi and dendritic neuron models. These models have shown promise in enhancing forecasting accuracy through innovative training algorithms and optimization techniques. The motivation for the current study is to propose a novel deep recurrent artificial neural network, termed DeepDenT, which incorporates a new “dendritic cell” structure designed to improve forecasting capabilities. This architecture aims to combine the advantages of both shallow and deep learning approaches, addressing common issues such as local optima and overfitting through a differential evolution optimization method. The subsequent sections of the paper will detail the proposed models and their applications, particularly in stock market time series forecasting.
Discussion
In this section, the authors discuss the development and architecture of the Multi-Dendritic Neural Model (MDNM) artificial neural network, which extends the original DNM-ANN proposed by Todo et al. (2014) to a multi-output structure. This modification allows for a more complex cell structure within deep neural networks, enabling the generation of multiple outputs from a single input set. The section outlines the mathematical formulations for calculating the network’s outputs, including synaptic, dendritic, and membrane functions, as well as the overall output, emphasizing the importance of activation function parameters in producing diverse outputs. The total number of parameters in the MDNM is specified as \(2pm + 2n + 1\), where \(p\) represents the number of inputs, \(m\) the number of dendrites, and \(n\) the number of outputs.
Furthermore, the authors introduce the Dendritic Cell (DnC) structure, which operates similarly to LSTM and GRU cells, allowing for multiple inputs and outputs. The architecture of the DeepDenT deep artificial neural network, which incorporates DnCs, is also presented. This network is designed for time series forecasting, utilizing a partially connected structure with shared parameters across hidden layers to optimize performance. The training algorithm for DeepDenT is based on differential evolution optimization, incorporating strategies for early stopping and parameter resetting to enhance training efficacy. The authors report that DeepDenT demonstrates superior forecasting performance compared to established methods, particularly in predicting stock market indices, thus highlighting its potential for future applications in automated forecasting systems.
