DOI: https://doi.org/10.1186/s40854-024-00643-1
تاريخ النشر: 2024-08-05
المؤلف: Oluwadamilare Omole وآخرون
الموضوع الرئيسي: طرق التنبؤ بسوق الأسهم
نظرة عامة
تستكشف هذه الورقة البحثية تطبيق نماذج التعلم العميق، وتحديدًا الشبكة العصبية التلافيفية – الذاكرة القصيرة والطويلة (CNN-LSTM)، وشبكة السلاسل الزمنية الطويلة والقصيرة (LSTNet)، والشبكة التلافيفية الزمنية (TCN)، جنبًا إلى جنب مع نموذج ARIMA القياسي، للتنبؤ بتحركات سعر البيتكوين باستخدام بيانات السلسلة. تستخدم الدراسة تقنيات اختيار ميزات متنوعة، بما في ذلك بوروتا، والخوارزمية الجينية (GA)، وآلة تعزيز التدرج الخفيف (LightGBM)، للتخفيف من لعنة الأبعاد المرتبطة بمجموعة ميزات كبيرة. تُظهر النتائج أن الجمع بين اختيار ميزات بوروتا ونموذج CNN-LSTM يحقق أعلى دقة بنسبة 82.44%، متفوقًا بشكل كبير على التكوينات الأخرى، بما في ذلك مجموعة GA-ARIMA، التي حققت أداءً أقصى قدره 0.5061.
يتم تقييم ربحية النماذج التنبؤية من خلال اختبار ثلاث استراتيجيات تداول، مما يكشف أن نهج الاستثمار الطويل والقصير، المستند إلى توقعات دقيقة لاتجاه السعر، حقق عائدًا سنويًا استثنائيًا بنسبة 6654% مع انخفاض أقصى قابل للإدارة (MDD) بنسبة 0.0704. تسلط هذه الدراسة الضوء على إمكانيات النماذج التنبؤية في تعزيز استراتيجيات التداول داخل سوق العملات المشفرة المتقلبة، مما يشير إلى أنه يمكن اتخاذ خيارات استثمار ذكية من خلال التنبؤ الدقيق بالأسعار. تشمل اتجاهات البحث المستقبلية دمج بيانات المشاعر ومؤشرات التحليل الفني لتحسين دقة التنبؤ، بالإضافة إلى استكشاف أداء النموذج تحت ظروف السوق المتغيرة لالتقاط الاتجاهات طويلة الأجل بشكل فعال.
مقدمة
تتبع مقدمة هذه الورقة البحثية تطور المال الرقمي، بدءًا من المفاهيم المبكرة لديفيد تشوم في الثمانينيات وانتهاءً بإطلاق البيتكوين بواسطة ساتوشي ناكاموتو في عام 2008. لقد سهلت تقنية البيتكوين الأساسية، البلوكشين، منذ ذلك الحين ظهور العديد من العملات المشفرة، بما في ذلك الإيثيريوم والريبل، التي تعد بابتكارات في المدفوعات، والهوية الرقمية، وتتبع سلسلة التوريد. ومع ذلك، يتميز سوق العملات المشفرة بتقلبات عالية، وغالبًا ما تتجاوز تلك الموجودة في الأصول التقليدية مثل الذهب، مما يقدم تحديات للمستثمرين ويتطلب تطوير نماذج تنبؤية لتوجيه قرارات الاستثمار.
تؤكد الورقة على الحاجة إلى نماذج تنبؤية متقدمة تستفيد من بيانات السلسلة الفريدة من تقنية البلوكشين لفهم ديناميكيات تسعير البيتكوين بشكل أفضل. وتبرز إمكانيات نماذج التعلم الآلي (ML)، وخاصة أساليب التعلم العميق (DL)، لكشف العلاقات المعقدة داخل بيانات السوق، مما يحسن دقة التنبؤ. تهدف الدراسة إلى استكشاف فعالية نماذج DL المختلفة، مثل الشبكة العصبية التلافيفية – الذاكرة القصيرة والطويلة (CNN-LSTM) والشبكات التلافيفية الزمنية (TCN)، في التنبؤ باتجاه سعر البيتكوين، مع معالجة اختيار الميزات للتخفيف من لعنة الأبعاد. تسعى الدراسة إلى سد الفجوات الموجودة في الأدبيات من خلال مقارنة هذه النماذج وتقييم ربحيتها من خلال استراتيجيات تداول مختلفة، بهدف تعزيز فهم تقنيات التنبؤ في سوق العملات المشفرة.
الطرق
توضح هذه القسم المنهجيات المستخدمة لاختيار الميزات وتنبؤ سعر البيتكوين في الدراسة. تسلط الضوء على التحديات التي تطرحها مجموعات الميزات الكبيرة، والتي يمكن أن تؤدي إلى الإفراط في التكيف، وتناقش طرق اختيار الميزات المختلفة المستخدمة في الأبحاث السابقة. من الجدير بالذكر أن طرقًا مثل خوارزمية بوروتا، والخوارزميات الجينية (GA)، وتصفية الارتباط قد تم استخدامها لتحديد الميزات ذات الصلة من مجموعات البيانات التي تشمل بيانات الأسعار، وبيانات المشاعر، والمؤشرات الفنية، والمتغيرات الاقتصادية الكلية. تشير النتائج إلى أنه بينما يمكن أن يعزز اختيار الميزات أداء النموذج، فإن فعاليته تختلف، حيث تشير بعض الدراسات إلى أن عدم اختيار الميزات قد يؤدي إلى نتائج أفضل لبعض النماذج.
فيما يتعلق بتنبؤ سعر البيتكوين، تستعرض هذه القسم نماذج التعلم الآلي (ML) المتعددة، بما في ذلك الانحدار باستخدام الدعم (SVR)، والغابات العشوائية (RF)، وأساليب التعلم العميق (DL) مثل الشبكات الذاكرة القصيرة والطويلة (LSTM). تشير النتائج إلى أن النماذج المختلفة تتفوق تحت ظروف متغيرة، حيث حقق TWSVR أعلى درجة تباين مفسر قدرها 0.9547 وتفوق على النماذج التقليدية مثل ARIMA. تشمل المنهجية المستخدمة في هذه الدراسة إعداد البيانات، وهندسة الميزات، وتدريب النموذج وتقييمه، وتنفيذ استراتيجيات التداول لتقييم ربحية التنبؤ. تتكون مجموعة البيانات التجريبية من 87 مقياسًا على السلسلة، وتم تطبيق ثلاث طرق لاختيار الميزات للتخفيف من مشاكل الأبعاد، مما أدى إلى إنشاء مجموعات فرعية متعددة لتدريب النموذج وتقييمه.
النتائج
تكشف نتائج هذه الدراسة، التي حللت 87 مقياسًا متميزًا على السلسلة جنبًا إلى جنب مع بيانات سعر البيتكوين من 6 فبراير 2013 إلى 18 فبراير 2023، عن رؤى مهمة حول استراتيجيات التداول. قامت عملية الاختبار الخلفي بتقييم نموذج بوروتا + CNN-LSTM مقابل معيار MACD، مع التركيز على بيئة محكومة برأس مال ابتدائي قدره 1000 دولار، ومعدل ضريبة بنسبة 30% على الأرباح، وتكلفة معاملات بنسبة 0.5%. حققت استراتيجية “الشراء والبيع الطويلة فقط” عائدًا سنويًا قدره 437% لكنها أظهرت انخفاضًا أقصى سلبيًا ملحوظًا (MDD)، بينما حققت استراتيجية “الشراء والبيع القصير فقط” عائدًا قدره 1084%، مما يدل على فعاليتها في الأسواق الهابطة. تفوقت استراتيجية “الطويل والقصير” على كلاهما، مع عائد سنوي مثير للإعجاب يتجاوز 6600% وأعلى نسبة شارب، مما يشير إلى توازن جيد بين المخاطر والعائد.
تم تحقيق مزيد من التحقق من أداء النموذج من خلال محاكاة باستخدام تحركات الأسعار الفعلية، مما أسفر عن عوائد سنوية قدرها 918%، 1803%، و20,453% للاستراتيجيات المعنية. أظهر نموذج بوروتا + CNN-LSTM درجة دقة قدرها 0.8309 ودرجة استرجاع قدرها 0.8078، مما يبرز قدرته على تحديد الصفقات المربحة بدقة. ومع ذلك، فإن الاستراتيجيات التي تتضمن آليات حماية الأسعار حققت عوائد أقل، مما يشير إلى وجود تبادل بين إدارة المخاطر وفرص الربح. بشكل عام، تؤكد النتائج على فعالية النماذج التنبؤية في تعزيز اتخاذ قرارات التداول، متماشية مع الأبحاث السابقة التي أجراها بيرافيتشساكول وآخرون (2021).
المناقشة
تسلط قسم المناقشة في الورقة البحثية الضوء على تطور نماذج التعلم الآلي (ML) في التنبؤ بأسعار البيتكوين، مع التأكيد على أهمية أنواع بيانات الإدخال، وهندسة النموذج، وخصائص المخرجات. تشمل أنواع الإدخال الرئيسية المؤشرات الفنية، وبيانات المشاعر من منصات مثل تويتر وجوجل تريندز، وبيانات السلسلة من معاملات البيتكوين. بينما أظهرت بيانات المشاعر إمكانات لتعزيز أداء النموذج، لا تزال التحديات مثل الطبيعة المضاربية ومشكلات سلامة البيانات قائمة. لقد تم دراسة المؤشرات الفنية على نطاق واسع، مع الإشارة إلى أن دمجها يحسن بشكل كبير من القدرات التنبؤية. بدأت الدراسات الحديثة أيضًا في استكشاف بيانات السلسلة، كاشفة عن تأثيرها الكبير على ديناميكيات سعر البيتكوين، على الرغم من الحاجة إلى مزيد من البحث لتحسين طرق هندسة الميزات في هذا المجال.
تحدد الورقة فجوة بحثية ملحوظة في تطبيق نماذج التعلم العميق (DL)، وخاصة الاستكشاف المحدود لهياكل مثل CNN-LSTM وTCN وLSTNet بالتزامن مع بيانات السلسلة. تفترض أن الأدبيات الحالية قد ركزت بشكل أساسي على أساليب الانحدار مقابل التصنيف لتنبؤ تحركات الأسعار، مع الإشارة إلى أن أساليب التصنيف قد تؤدي إلى نتائج أكثر ربحية. تهدف الدراسة إلى معالجة هذه الفجوات من خلال استخدام ميزات مختارة من السلسلة ونماذج DL المتقدمة للتنبؤ بالتحركات الاتجاهية في أسعار البيتكوين، مما يساهم في فهم أعمق لديناميكيات سعر البيتكوين. تختتم القسم بتحديد خطوات المعالجة المسبقة، وطرق اختيار الميزات، وهندسات النماذج المستخدمة في الدراسة، مما يمهد الطريق للتحليلات والتقييمات اللاحقة.
DOI: https://doi.org/10.1186/s40854-024-00643-1
Publication Date: 2024-08-05
Author(s): Oluwadamilare Omole et al.
Primary Topic: Stock Market Forecasting Methods
Overview
This research paper investigates the application of deep learning models, specifically convolutional neural network-long short-term memory (CNN-LSTM), long-and short-term time-series network (LSTNet), and temporal convolutional network (TCN), alongside a benchmark ARIMA model, to predict Bitcoin price movements using on-chain data. The study employs various feature-selection techniques, including Boruta, genetic algorithm (GA), and light gradient boosting machine (LightGBM), to mitigate the curse of dimensionality associated with a large feature set. The results demonstrate that the combination of Boruta feature selection and the CNN-LSTM model achieves the highest accuracy of 82.44%, significantly outperforming other configurations, including the GA-ARIMA combination, which yielded a maximum performance of 0.5061.
The profitability of the predictive models is further evaluated through backtesting three trading strategies, revealing that a long-and-short investment approach, informed by accurate price-direction predictions, generated an extraordinary annual return of 6654% with a manageable maximum drawdown (MDD) of 0.0704. This study highlights the potential of predictive models in enhancing trading strategies within the volatile cryptocurrency market, suggesting that intelligent investment choices can be made through accurate price forecasting. Future research directions include the incorporation of sentiment data and technical analysis indicators to improve prediction accuracy, as well as exploring model performance under varying market conditions to capture long-term trends effectively.
Introduction
The introduction of this research paper traces the evolution of digital money, beginning with David Chaum’s early concepts in the 1980s and culminating in the launch of Bitcoin by Satoshi Nakamoto in 2008. Bitcoin’s underlying technology, blockchain, has since facilitated the emergence of various cryptocurrencies, including Ethereum and Ripple, which promise innovations in payments, digital identity, and supply chain tracking. However, the cryptocurrency market is characterized by high volatility, often exceeding that of traditional assets like gold, which presents challenges for investors and necessitates the development of predictive models to guide investment decisions.
The paper emphasizes the need for advanced predictive models that leverage unique on-chain data from blockchain technology to better understand Bitcoin’s pricing dynamics. It highlights the potential of machine learning (ML) models, particularly deep learning (DL) approaches, to uncover complex relationships within market data, thereby improving prediction accuracy. The research aims to explore the effectiveness of various DL models, such as convolutional neural network-long short-term memory (CNN-LSTM) and temporal convolutional networks (TCN), in predicting Bitcoin price direction, while also addressing feature selection to mitigate the curse of dimensionality. The study seeks to fill existing gaps in the literature by comparing these models and assessing their profitability through different trading strategies, ultimately aiming to enhance the understanding of predictive techniques in the cryptocurrency market.
Methods
The section outlines the methodologies employed for feature selection and Bitcoin price prediction in the study. It highlights the challenges posed by large feature sets, which can lead to overfitting, and discusses various feature-selection methods utilized in prior research. Notably, methods such as the Boruta algorithm, genetic algorithms (GA), and correlation filtering have been employed to identify relevant features from datasets that include price data, sentiment data, technical indicators, and macroeconomic variables. The findings indicate that while feature selection can enhance model performance, its effectiveness varies, with some studies suggesting that no feature selection may yield superior results for certain models.
In terms of Bitcoin price prediction, the section reviews multiple machine learning (ML) models, including support vector regression (SVR), random forests (RF), and deep learning (DL) approaches like long short-term memory (LSTM) networks. The results indicate that different models excel under varying conditions, with TWSVR achieving the highest explained variance score of 0.9547 and outperforming traditional models like ARIMA. The methodology employed in this study involves data preparation, feature engineering, model training and evaluation, and the implementation of trading strategies to assess prediction profitability. The experimental dataset consists of 87 on-chain metrics, and three feature-selection methods were applied to mitigate dimensionality issues, leading to the creation of multiple subsets for model training and evaluation.
Results
The results of this study, which analyzed 87 distinct on-chain metrics alongside Bitcoin price data from February 6, 2013, to February 18, 2023, reveal significant insights into trading strategies. The backtesting process evaluated the Boruta + CNN-LSTM model against a MACD benchmark, focusing on a controlled environment with a starting capital of $1000, a 30% tax rate on profits, and a transaction cost of 0.5%. The “long-only buy-and-sell” strategy yielded an annual return of 437% but exhibited a notably negative maximum drawdown (MDD), while the “short-only buy-and-sell” strategy achieved a return of 1084%, demonstrating effectiveness in bearish markets. The “long-and-short” strategy outperformed both, with an impressive annual return exceeding 6600% and the highest Sharpe ratio, indicating a favorable risk-return balance.
Further validation of the model’s performance was achieved through a simulation using actual price movements, resulting in annual returns of 918%, 1803%, and 20,453% for the respective strategies. The Boruta + CNN-LSTM model demonstrated a precision score of 0.8309 and a recall score of 0.8078, highlighting its capability in accurately identifying profitable trades. However, strategies incorporating price protection mechanisms yielded lower returns, suggesting a trade-off between risk management and profit opportunities. Overall, the findings underscore the effectiveness of predictive models in enhancing trading decision-making, aligning with previous research by Piravechsakul et al. (2021).
Discussion
The discussion section of the research paper highlights the evolution of machine learning (ML) models in predicting Bitcoin prices, emphasizing the importance of input data types, model architecture, and output characteristics. Key input types include technical indicators, sentiment data from platforms like Twitter and Google Trends, and on-chain data from Bitcoin transactions. While sentiment data has shown potential to enhance model performance, challenges such as speculative nature and data integrity issues persist. Technical indicators have been widely studied, with findings indicating that their integration significantly improves predictive capabilities. Recent studies have also begun to explore on-chain data, revealing its substantial influence on Bitcoin price dynamics, although further research is needed to optimize feature engineering methods in this area.
The paper identifies a notable research gap in the application of deep learning (DL) models, particularly the limited exploration of architectures like CNN-LSTM, TCN, and LSTNet in conjunction with on-chain data. It posits that existing literature has primarily focused on regression versus classification approaches for predicting price movements, with findings suggesting that classification methods may yield more profitable outcomes. The study aims to address these gaps by employing selected on-chain features and advanced DL models to predict directional movements in Bitcoin prices, thereby contributing to a deeper understanding of Bitcoin price dynamics. The section concludes by outlining the preprocessing steps, feature selection methods, and model architectures utilized in the study, setting the stage for subsequent analyses and evaluations.
