التنبؤ غير الخطي مع العديد من المتنبئين باستخدام نماذج الانحدار باستخدام بيانات مختلطة
Nonlinear forecasting with many predictors using mixed data sampling kernel ridge regression models

المجلة: Annals of Operations Research
DOI: https://doi.org/10.1007/s10479-025-06486-y
تاريخ النشر: 2025-01-23
المؤلف: Deliang Dai وآخرون
الموضوع الرئيسي: طرق ونماذج إحصائية متقدمة

نظرة عامة

تتناول هذه الورقة البحثية الحاجة إلى توقعات اقتصادية دقيقة من قبل معاهد السياسات، وخاصة البنوك المركزية، لإبلاغ سياسات الاستقرار. تقدم مقدر انحدار كيرنيل ريدج (KRR) ضمن إطار عمل أخذ عينات البيانات المختلطة، القادر على إدارة العديد من المتغيرات التنبؤية ذات العلاقات غير الخطية مع المتغير المستهدف. توضح الدراسة من خلال محاكاة مونت كارلو أن KRR يتفوق على الطرق التقليدية المعتمدة على المكونات الرئيسية من حيث متوسط مربع الخطأ والصلابة ضد عمليات توليد البيانات غير الخطية المختلفة. باستخدام مجموعة بيانات تضم 24 مؤشراً اقتصادياً، يتوقع المؤلفون الناتج المحلي الإجمالي السويدي (GDP) ويؤكدون تفوق نهج KRR على الطرق الحالية.

في الاستنتاجات، تنتقد الورقة الإطار القياسي U-MIDAS المستخدم في توقع الناتج المحلي الإجمالي، داعية إلى استخدام طريقة KRR لمعالجة عدم الخطية والأبعاد العالية بشكل أفضل، خاصة في سياق الاضطرابات الاقتصادية الأخيرة مثل الجائحة وحرب أوكرانيا. تشير نتائج المحاكاة إلى أن KRR فعالة بشكل خاص للبيانات التي تظهر هيكل عامل، وهو شائع في المالية والاقتصاد. التطبيق التجريبي يثبت أيضاً فعالية طريقة KRR في توقع نمو الناتج المحلي الإجمالي السويدي ربع السنوي على أساس سنوي، خاصة خلال فترات التقلبات الاقتصادية الكبيرة. يوصي المؤلفون بأن تتبنى معاهد السياسات، بما في ذلك المعهد الوطني للبحوث الاقتصادية (NIER)، طرق KRR جنباً إلى جنب مع الطرق التقليدية لتحسين توقعات الناتج المحلي الإجمالي ومؤشرات اقتصادية حيوية أخرى.

مقدمة

تسلط مقدمة هذه الورقة البحثية الضوء على الحاجة المتزايدة لتحسين طرق التوقع الاقتصادي بسبب جائحة COVID-19 والحرب في أوكرانيا. تستخدم البنوك المركزية ومعاهد السياسات الاقتصادية تقنيات التوقع التقليدية، وخاصة انحدار أخذ عينات البيانات المختلطة (MIDAS)، لمعالجة عدم توافق التردد بين المؤشرات الاقتصادية عالية التردد والقياسات منخفضة التردد مثل الناتج المحلي الإجمالي (GDP). تناقش الورقة تطور نماذج MIDAS، بما في ذلك تقديم انحدار U-MIDAS غير المقيد، الذي يسمح بتقدير أبسط باستخدام المربعات الصغرى العادية (OLS) وقد أظهر أداءً متفوقاً في السيناريوهات التي تحتوي على عدم توافق ترددات طفيف.

يقترح المؤلفون نهجاً جديداً لانحدار كيرنيل ريدج (KRR) ضمن إطار MIDAS لالتقاط العلاقات غير الخطية بشكل أفضل بين المتغيرات الاقتصادية الكلية المأخوذة بترددات مختلفة. يوضحون من خلال دراسات المحاكاة أن KRR، وخاصة مع نواة غاوسية، يتفوق على كل من الطرق المعتمدة على المكونات الرئيسية ونماذج U-MIDAS القياسية، خاصة في العينات الأكبر وعمليات توليد البيانات غير الخطية (DGPs). يدعم التطبيق التجريبي باستخدام بيانات من المعهد الوطني للبحوث الاقتصادية (NIER) في السويد فعالية KRR، مما يشير إلى أن معاهد التوقع ينبغي أن تفكر في اعتماد طرق قائمة على النواة لتحسين دقة توقعات النشاط الاقتصادي. تم هيكلة الورقة لتقديم نظرة شاملة على نموذج U-MIDAS، ومنهجية KRR، وتصميم المحاكاة، والنتائج، والنتائج التجريبية.

طرق

توضح قسم المنهجية نهج انحدار كيرنيل ريدج (KRR)، الذي يعزز إطار انحدار U-MIDAS من خلال معالجة القيود المتعلقة بعدم الخطية والبيانات عالية الأبعاد. يتم تقديم مقدر KRR كحل لهذه التحديات، وتتم مناقشة وظائف النواة المختلفة من حيث كفاءتها الحاسوبية. تركز الدراسة على توقع نمو الناتج المحلي الإجمالي ربع السنوي في السويد، باستخدام مجموعة بيانات من قاعدة بيانات ماكروبوند تشمل 24 متغيراً شهرياً تم تحويلها إلى 72 متغيراً تنبؤياً من خلال التفكيك الزمني.

يتم تقييم أداء التوقع باستخدام بيانات من يناير 2000 إلى مارس 2021، مع توليد توقعات خارج العينة لآفاق زمنية \(t + 1\) و \(t + 2\). يتم استخدام استراتيجية نافذة متحركة، حيث يتم ملاءمة النماذج على مدى 44 ربعاً. يتم مقارنة طريقة KRR مع عدة نماذج معتمدة، بما في ذلك انحدار PC-squared وانحدار غربال متعدد الحدود، مع تنفيذ نسخ ديناميكية لالتقاط التأثيرات المتأخرة. يتم توجيه اختيار المكونات الرئيسية والفترات الزمنية من خلال تقليل متوسط مربع خطأ التوقع (MSPE). تشير النتائج إلى أن النموذج غير الخطي متعدد الحدود يتفوق على الآخرين في توقعات \(t + 2\)، بينما يثبت التحقق المتقاطع الكتلي تفوقه للنموذج الخطي عند \(t + 1\)، مما يبرز أهمية تحديد النموذج في دقة التوقعات.

نقاش

يتناول قسم النقاش في الورقة البحثية إطار انحدار U-MIDAS، الذي يستخدم بيانات تردد مختلط لنمذجة العلاقات بين المتغيرات التنبؤية عالية التردد والمتغير التابع منخفض التردد. يقترح المؤلفون تحسينات على هذا الإطار من خلال دمج مقدرات من نوع الانكماش، مثل انحدار كيرنيل ريدج (KRR)، لمعالجة التحديات المرتبطة بالبيانات عالية الأبعاد. يسمح نهج KRR بإدراج العلاقات غير الخطية بين المتغيرات التنبؤية، وهو أمر ذو صلة خاصة في السياقات التي قد تفشل فيها النماذج الخطية التقليدية في التقاط الديناميات المعقدة. تؤكد الورقة على أهمية اختيار معلمات الضبط المناسبة ووظائف النواة، مثل النوى متعددة الحدود ونوى غاوسية، لتحسين أداء النموذج.

من خلال محاكاة مونت كارلو، يقيم المؤلفون قدرات التوقع لمختلف النماذج، بما في ذلك KRR وطرق انحدار المكونات الرئيسية، تحت عمليات توليد بيانات مختلفة (DGPs) تتميز بعلاقات خطية وغير خطية. تشير النتائج إلى أن KRR، خاصة مع نواة غاوسية، تميل إلى التفوق على الطرق التقليدية في أحجام العينات الأكبر وتحت ظروف عالية من نسبة الإشارة إلى الضوضاء. يوضح التطبيق التجريبي لتوقع نمو الناتج المحلي الإجمالي السويدي المزايا العملية لـ KRR، خاصة خلال فترات عدم الاستقرار الاقتصادي، مما يشير إلى أن المؤسسات السياسية ينبغي أن تدمج طرق KRR جنباً إلى جنب مع الأساليب التقليدية لتحسين دقة التوقعات.

Journal: Annals of Operations Research
DOI: https://doi.org/10.1007/s10479-025-06486-y
Publication Date: 2025-01-23
Author(s): Deliang Dai et al.
Primary Topic: Advanced Statistical Methods and Models

Overview

This research paper addresses the need for accurate economic forecasts by policy institutes, particularly central banks, to inform stabilization policies. It introduces a kernel ridge regression (KRR) estimator within a mixed data sampling framework, which is capable of managing numerous predictors with nonlinear relationships to the target variable. The study demonstrates through a Monte Carlo simulation that KRR outperforms traditional principal component-based methods in terms of mean square error and robustness against various nonlinear data generating processes. Utilizing a dataset of 24 economic indicators, the authors forecast Swedish gross domestic product (GDP) and confirm the superiority of the KRR approach over existing methods.

In the conclusions, the paper critiques the standard U-MIDAS framework used for GDP forecasting, advocating for the KRR method to better address nonlinearity and high dimensionality, particularly in the context of recent economic disruptions such as the pandemic and the Ukraine war. The simulation results indicate that KRR is particularly effective for data exhibiting a factor structure, which is common in finance and economics. The empirical application further validates the KRR method’s effectiveness in forecasting quarterly year-on-year Swedish GDP growth, especially during periods of significant economic volatility. The authors recommend that policy institutes, including the National Institute of Economic Research (NIER), adopt KRR methods alongside traditional approaches for improved forecasting of GDP and other critical economic indicators.

Introduction

The introduction of this research paper highlights the accelerated need for improved economic forecasting methods due to the COVID-19 pandemic and the war in Ukraine. Traditional forecasting techniques, particularly mixed data sampling (MIDAS) regression, are employed by central banks and economic policy institutes to address the frequency misalignment between high-frequency economic indicators and lower-frequency measures like gross domestic product (GDP). The paper discusses the evolution of MIDAS models, including the introduction of unrestricted-MIDAS (U-MIDAS) regression, which allows for simpler estimation using ordinary least squares (OLS) and has shown superior performance in scenarios with minor frequency mismatches.

The authors propose a novel kernel ridge regression (KRR) approach within the MIDAS framework to better capture non-linear relationships among macroeconomic variables sampled at different frequencies. They demonstrate through simulation studies that KRR, particularly with a Gaussian kernel, outperforms both principal component-based methods and standard U-MIDAS models, especially in larger samples and non-linear data generating processes (DGPs). The empirical application using data from the National Institute of Economic Research (NIER) in Sweden further supports the efficacy of KRR, suggesting that forecasting institutes should consider adopting kernel-based methods for enhanced accuracy in economic activity predictions. The paper is structured to provide a comprehensive overview of the U-MIDAS model, KRR methodology, simulation design, results, and empirical findings.

Methods

The methodology section outlines the Kernel Ridge Regression (KRR) approach, which enhances the U-MIDAS regression framework by addressing limitations related to nonlinearity and high-dimensional data. The KRR estimator is introduced as a solution to these challenges, and various kernel functions are discussed for their computational efficiency. The study focuses on forecasting quarterly year-on-year GDP growth in Sweden, utilizing a dataset from the Macrobond database that includes 24 monthly variables transformed into 72 predictors through temporal disaggregation.

The forecasting performance is evaluated using data from January 2000 to March 2021, with out-of-sample forecasts generated for time horizons \(t + 1\) and \(t + 2\). A rolling window strategy is employed, fitting models over 44 quarters. The KRR method is benchmarked against several established models, including PC-squared regression and polynomial sieve regression, with dynamic versions implemented to capture delayed effects. The selection of principal components and lags is guided by minimizing the Mean Squared Prediction Error (MSPE). Results indicate that the nonlinear polynomial model outperforms others for \(t + 2\) forecasts, while block cross-validation proves superior for the linear model at \(t + 1\), highlighting the importance of model specification in forecasting accuracy.

Discussion

The discussion section of the research paper elaborates on the U-MIDAS regression framework, which utilizes mixed frequency data to model relationships between high-frequency predictors and a low-frequency dependent variable. The authors propose enhancements to this framework by incorporating shrinkage-type estimators, such as kernel ridge regression (KRR), to address challenges associated with high-dimensional data. The KRR approach allows for the inclusion of nonlinear relationships among predictors, which is particularly relevant in contexts where traditional linear models may fail to capture complex dynamics. The paper emphasizes the importance of selecting appropriate tuning parameters and kernel functions, such as polynomial and Gaussian kernels, to optimize model performance.

Through a Monte Carlo simulation, the authors evaluate the forecasting capabilities of various models, including KRR and principal component regression methods, under different data generation processes (DGPs) characterized by linear and nonlinear relationships. Results indicate that KRR, especially with a Gaussian kernel, tends to outperform traditional methods in larger sample sizes and under conditions of high signal-to-noise ratios. The empirical application to Swedish GDP growth forecasting demonstrates the practical advantages of KRR, particularly during periods of economic instability, suggesting that policy institutions should integrate KRR methods alongside conventional approaches for improved forecasting accuracy.