DOI: https://doi.org/10.1007/s42521-026-00188-1
تاريخ النشر: 2026-03-26
المؤلف: Florin-Sebastian Duma وآخرون
الموضوع الرئيسي: طرق التنبؤ بسوق الأسهم
نظرة عامة
تبحث الورقة في العلاقة بين مؤشر سوق الأسهم الروماني BET ومؤشرات دولية رئيسية مختلفة، بما في ذلك تلك من الولايات المتحدة وأوروبا الغربية وأوروبا الوسطى والشرقية. باستخدام أدوات البرمجة الجينية، يقوم المؤلفون بنمذجة قيم مؤشر BET على فترات زمنية قصيرة ومقارنة هذه النماذج مع الأساليب التقليدية للتعلم الآلي. تكشف التحليلات عن تحديات كبيرة في التنبؤ على المدى القصير بسبب التعقيد والاختلافات الكامنة في البيانات، حيث تظهر معظم الأساليب قدرة تنبؤية محدودة.
تشير النتائج إلى أن الارتباط الضعيف بين مؤشر BET ومؤشرات أخرى، خاصة في الأطر الزمنية القصيرة، يمكن أن يُعزى إلى عوامل هيكلية داخل السوق الروماني. ومن الجدير بالذكر أن إدخال نظام التقاعد الخاص الإلزامي (الركيزة الثانية) قد أدى إلى أن تصبح صناديق التقاعد مستثمرين مهيمنين، مما يؤثر على سيولة السوق وديناميات التداول. بالإضافة إلى ذلك، فإن غياب آليات البيع على المكشوف يقيّد أيضًا القدرة على التنبؤ على المدى القصير. يقترح المؤلفون أن هذه الخصائص السوقية، بدلاً من عدم كفاية النماذج، تساهم في الصعوبات الملحوظة في التنبؤ. ستستكشف الأبحاث المستقبلية منهجيات متقدمة، بما في ذلك التعلم العميق والنماذج الهجينة، بالإضافة إلى تطبيق مفاهيم نظرية الألعاب لتعزيز فهم ديناميات السوق وتحسين القدرات التنبؤية.
مقدمة
تناقش مقدمة هذه الورقة البحثية تطور منهجيات التنبؤ بسوق الأسهم، مع تسليط الضوء على الانتقال من الأساليب التقليدية—مثل التحليل الأساسي والفني—إلى التقنيات الحديثة التي تستفيد من التعلم الآلي والذكاء الاصطناعي. يركز المؤلفون على نهج متعدد التخصصات يجمع بين الاقتصاد وعلوم الكمبيوتر للتنبؤ بمؤشرات سوق الأسهم لعشرة مؤشرات مرجعية من الولايات المتحدة وأوروبا الغربية وأوروبا الوسطى والشرقية، باستخدام طرق قائمة على البرمجة الجينية.
تشدد الورقة على الفجوة في اهتمام البحث بين الأسواق المتقدمة، مثل تلك الموجودة في الولايات المتحدة وأوروبا الغربية، والأسواق الناشئة، وخاصة في أوروبا الوسطى والشرقية (CEE). بينما تم تحليل الأولى بشكل مكثف، لا تزال الأخيرة، وخاصة سوق الأسهم الروماني، غير مستكشفة بشكل كافٍ. يجادل المؤلفون بأهمية دراسة مؤشر سوق الأسهم الروماني بالمقارنة مع نظرائه، مشيرين إلى أن مثل هذا التحليل يمكن أن يوفر رؤى قيمة للمستثمرين والباحثين. بالإضافة إلى ذلك، تهدف الدراسة إلى تقييم قابلية تطبيق البرمجة الجينية لمهام الانحدار في سياق العالم الحقيقي، مع ملاحظة مرونتها وقدرتها على التكيف في توليد حلول مخصصة لتحديات البيانات المعقدة.
الطرق
في هذه الدراسة، يستكشف المؤلفون فعالية تطبيقات البرمجة الجينية (GP) المتاحة للجمهور للتنبؤ المالي، مع التركيز بشكل خاص على مؤشر BET بالنسبة لمؤشرات سوق الأسهم المتعددة. تهدف الأبحاث إلى تقييم أداء طرق GP مقابل نماذج الانحدار المعتمدة، مع معالجة الحاجة إلى تقنيات نمذجة متطورة يمكن الوصول إليها للباحثين خارج مجال علوم الكمبيوتر. تم هيكلة التحليل حول أربع مجموعات من المقارنات التي تشمل مؤشرات من الولايات المتحدة وأوروبا الغربية وأوروبا الوسطى والشرقية، ومجموعة شاملة من جميع المؤشرات المختارة. تشير النتائج إلى وجود ارتباط قوي بين مؤشر BET وعدة مؤشرات رئيسية، خاصة على المدى الطويل، بينما تكشف الفترات الزمنية القصيرة عن ارتباط أقل، مما يبرز أهمية الديناميات الزمنية في سلوك السوق.
شمل الإعداد التجريبي تدريب نماذج GP على فترات 30 و60 يومًا، تليها مرحلة اختبار لمدة 10 أيام، مع تواريخ بدء عشوائية وتجارب متكررة لأخذ الطبيعة العشوائية لطرق GP في الاعتبار. استخدمت الدراسة معامل التحديد ($R^2$) كمقياس للأداء، حيث تشير القيم الأقرب إلى 1 إلى توافق أفضل بين القيم المتوقعة والفعلية. تظهر النتائج اختلافات كبيرة في قيم الارتباط بين البيانات قصيرة المدى والبيانات العامة، مما يشير إلى أن فترات التدريب الأقصر قد تكون أكثر صلة باتخاذ القرارات في الأسواق المتقلبة. توازن هذه المنهجية بشكل فعال بين التحقق التقليدي من التدريب والاختبار مع الأساليب المتقدمة، مع الحفاظ على الهيكل الزمني للبيانات أثناء تقييم أداء النموذج.
النتائج
في هذا القسم، يقدم المؤلفون نتائج تحليلهم باستخدام حزمة autorank، التي تلتزم بالإرشادات التي وضعتها Demšar (2006) لتخفيف تحيز الاختبار المتعدد. شمل التحليل مقارنة أداء ثمانية طرق مختلفة عبر فترتين تدريبيتين (30 يومًا و60 يومًا) باستخدام بيانات من 20 فترة مختارة عشوائيًا، حيث خضعت كل فترة لـ 10 تجارب مستقلة. استخدم المؤلفون اختبار فريدمان غير المعلمي لتقييم الفروق بين الطرق، تلاه اختبار نيميني لتحليل ما بعد hoc لتحديد الفروق المهمة في أداء الطرق.
تشير النتائج إلى أن مؤشر BET أظهر أقل ارتباط مع مؤشرات أخرى، والتي كانت موزعة بشكل طبيعي. يتم تلخيص نتائج اختبار فريدمان مع إحصائيات رئيسية، بما في ذلك الوسيط (MD)، والانحراف المطلق الوسيط (MAD)، ومتوسط الرتبة (MR)، وفترات الثقة (CI). تم تحديد مسافة حرجة (CD) تبلغ 2.348 لتحديد أهمية الفروق في الرتب بين الطرق. يتم تمثيل النتائج بصريًا من خلال مخططات المسافة الحرجة، موضحةً تصنيفات الطرق من الأداء المنخفض إلى العالي بناءً على التحليل الإحصائي الذي تم إجراؤه.
المناقشة
في هذا القسم، يناقش المؤلفون تطبيق طرق البرمجة الجينية (GP) في نمذجة المؤشرات المالية، مع التركيز بشكل خاص على مؤشر BET في سوق الأسهم الروماني بالنسبة لمؤشرات السوق الإقليمية والمتقدمة الأخرى. يبرزون التحديات في نمذجة سلاسل الأسعار بسبب عدم استقرارها وحساسيتها لأخطاء التنبؤ، مما يقارن ذلك بالنمذجة الأكثر بساطة للعوائد. تهدف الأبحاث إلى تحديد ما إذا كان بإمكان GP التنقل بفعالية في تعقيدات البيانات المالية، خاصة في الفترات المتقلبة التي تتسم بأحداث كبيرة مثل جائحة COVID-19 والتوترات الجيوسياسية.
يستعرض المؤلفون الأدبيات الموجودة حول تطبيقات التعلم الآلي في المالية، مشيرين إلى مزايا هذه التقنيات في مهام التنبؤ عبر قطاعات مختلفة، بما في ذلك البنوك والتأمين. يؤكدون أنه بينما غالبًا ما تكافح الأساليب الإحصائية التقليدية مع الديناميات غير الخطية لسلوك سوق الأسهم، يمكن أن تكشف GP وغيرها من نماذج التعلم الآلي المتقدمة عن أنماط معقدة، مما قد يؤدي إلى توقعات أكثر دقة. يختتم القسم بمناقشة أداء تطبيقات GP المختلفة مقارنة بأساليب الانحدار الكلاسيكية، كاشفًا أنه بينما تواجه طرق GP تحديات في التنبؤ بالأسعار غير المستقرة، إلا أنها لا تزال توفر رؤى قيمة حول ديناميات السوق. تشير النتائج إلى أن GP يمكن أن تكون أداة قوية للتنبؤ المالي، على الرغم من أنها قد لا تتفوق باستمرار على النماذج الأبسط في جميع السيناريوهات.
DOI: https://doi.org/10.1007/s42521-026-00188-1
Publication Date: 2026-03-26
Author(s): Florin-Sebastian Duma et al.
Primary Topic: Stock Market Forecasting Methods
Overview
The paper investigates the relationship between the Romanian stock market index BET and various major international indices, including those from the USA, Western Europe, and Central and Eastern Europe. Utilizing genetic programming tools, the authors model BET index values over short-term intervals and compare these models with traditional machine learning approaches. The analysis reveals significant challenges in short-term forecasting due to the inherent complexity and variability of the data, with most methods exhibiting limited predictive power.
The findings suggest that the weak correlation between the BET index and other indices, particularly in short time frames, can be attributed to structural factors within the Romanian market. Notably, the introduction of the mandatory private pension system (Pillar II) has led to pension funds becoming dominant investors, which affects market liquidity and trading dynamics. Additionally, the absence of short-selling mechanisms further constrains short-term predictability. The authors propose that these market characteristics, rather than model inadequacies, contribute to the observed difficulties in forecasting. Future research will explore advanced methodologies, including deep learning and hybrid models, as well as the application of game-theoretic concepts to enhance the understanding of market dynamics and improve predictive capabilities.
Introduction
The introduction of this research paper discusses the evolution of stock market prediction methodologies, highlighting the transition from traditional approaches—such as fundamental and technical analysis—to modern techniques leveraging machine learning and artificial intelligence. The authors focus on a multidisciplinary approach that combines economics and computer science to predict stock market indices for ten benchmark indices from the United States, Western Europe, and Central and Eastern Europe, employing genetic programming-based methods.
The paper emphasizes the disparity in research attention between developed markets, such as those in the US and Western Europe, and emerging markets, particularly in Central and Eastern Europe (CEE). While the former have been extensively analyzed, the latter, especially the Romanian stock market, remain underexplored. The authors argue for the importance of studying the Romanian stock market index in comparison to its peers, suggesting that such analysis could provide valuable insights for investors and researchers. Additionally, the study aims to assess the applicability of genetic programming for regression tasks in a real-world context, noting its flexibility and adaptability in generating tailored solutions for complex data challenges.
Methods
In this study, the authors investigate the effectiveness of various publicly available genetic programming (GP) implementations for financial forecasting, specifically focusing on the BET index in relation to multiple stock market indices. The research aims to evaluate the performance of GP methods against established regression models, addressing the need for accessible sophisticated modeling techniques for researchers outside of computer science. The analysis is structured around four sets of comparisons involving indices from the USA, Western Europe, Central and Eastern Europe, and a comprehensive grouping of all selected indices. The findings indicate a strong correlation between the BET index and several major indices, particularly over longer time frames, while shorter intervals reveal reduced correlation, highlighting the importance of temporal dynamics in market behavior.
The experimental setup involved training GP models on 30 and 60-day intervals, followed by a 10-day testing phase, with random starting dates and repeated trials to account for the stochastic nature of GP methods. The study employed the coefficient of determination ($R^2$) as a performance metric, where values closer to 1 indicate a better fit between predicted and actual values. The results demonstrate significant differences in correlation values between short-term and overall data, suggesting that shorter training periods may be more relevant for decision-making in volatile markets. This methodology effectively balances conventional train-test validation with walk-forward approaches, preserving the temporal structure of the data while evaluating model performance.
Results
In this section, the authors present the results of their analysis using the autorank package, which adheres to the guidelines established by Demšar (2006) to mitigate multiple testing bias. The analysis involved comparing the performance of eight different methods across two training durations (30 days and 60 days) using data from 20 randomly selected periods, with each period undergoing 10 independent runs. The authors employed the non-parametric Friedman test to evaluate differences among the methods, followed by the Nemenyi test for post hoc analysis to identify significant differences in method performance.
The results indicate that the BET index exhibited the lowest correlation with other indices, which were normally distributed. The Friedman test results are summarized with key statistics, including median (MD), median absolute deviation (MAD), mean rank (MR), and confidence intervals (CI). A critical distance (CD) of 2.348 was established to determine the significance of differences in ranks among the methods. The findings are visually represented through critical distance diagrams, illustrating the rankings of the methods from lower to higher performance based on the statistical analysis conducted.
Discussion
In this section, the authors discuss the application of genetic programming (GP) methods in modeling financial indices, specifically focusing on the Romanian stock market’s BET index in relation to other regional and developed market indices. They highlight the challenges of modeling price series due to their non-stationarity and sensitivity to prediction errors, contrasting this with the more straightforward modeling of returns. The research aims to determine whether GP can effectively navigate the complexities of financial data, particularly in volatile periods marked by significant events like the COVID-19 pandemic and geopolitical tensions.
The authors review existing literature on machine learning applications in finance, noting the advantages of these techniques in prediction tasks across various sectors, including banking and insurance. They emphasize that while traditional statistical methods often struggle with the nonlinear dynamics of stock market behavior, GP and other advanced machine learning models can uncover complex patterns, potentially leading to more accurate forecasts. The section concludes with a discussion of the performance of various GP implementations compared to classical regression methods, revealing that while GP methods face challenges in predicting non-stationary prices, they still provide valuable insights into market dynamics. The findings suggest that GP can be a powerful tool for financial forecasting, although it may not consistently outperform simpler models in all scenarios.
