نموذج هجين محسن بواسطة خوارزمية جينية لتوقع أسعار الزراعة استنادًا إلى VMD وشبكة LSTM
A genetic algorithm optimized hybrid model for agricultural price forecasting based on VMD and LSTM network

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-94173-0
PMID: https://pubmed.ncbi.nlm.nih.gov/40121306
تاريخ النشر: 2025-03-22
المؤلف: Kapil Choudhary وآخرون
الموضوع الرئيسي: طرق التنبؤ بسوق الأسهم

نظرة عامة

تقدم ورقة البحث نموذجًا هجينيًا جديدًا للتنبؤ، يسمى VMD-LSTM، مصممًا لتعزيز دقة توقعات أسعار السلع الزراعية. غالبًا ما تكافح النماذج التقليدية مع الخصائص غير الخطية وغير الثابتة لبيانات الأسعار، مما يؤدي إلى توقعات دون المستوى الأمثل. يدمج نموذج VMD-LSTM خوارزمية جينية (GA) مع تحليل الوضع المتغير (VMD) والشبكات العصبية للذاكرة طويلة وقصيرة المدى (LSTM). تستخدم هذه الطريقة أولاً VMD المحسن بواسطة GA لتفكيك سلسلة الأسعار إلى وظائف الوضع الجوهرية (IMFs)، التي تظهر تشتتًا وتساعد على تحقيق تقارب أسرع. ثم يتم توقع كل IMF باستخدام نماذج LSTM المحسنة بواسطة GA، ويتم تجميع التوقعات الفردية لتوليد توقع شامل لسلسلة الأسعار الفعلية.

تم تقييم أداء نموذج VMD-LSTM بدقة مقارنةً بنماذج LSTM الفردية ونماذج أخرى قائمة على التحليل (EMD-LSTM، EEMD-LSTM، CEEMDAN-LSTM) باستخدام بيانات أسعار شهرية للذرة، وزيت النخيل، وزيت الصويا. تشير النتائج إلى تحسينات كبيرة في دقة التنبؤ، مع انخفاض في خطأ الجذر المتوسط التربيعي (RMSE) بنسبة 56.93%، و21.83%، و27.00%، وانخفاض في خطأ النسبة المطلقة المتوسطة (MAPE) بنسبة 44%، و21.67%، و25.85% للذرة، وزيت النخيل، وزيت الصويا، على التوالي، مقارنةً بأفضل نموذج آخر، CEEMDAN-LSTM. تؤكد التحقق الإضافي من خلال TOPSIS واختبار ديبولد-مارينو أيضًا على القدرة التنبؤية المتفوقة لنموذج VMD-LSTM. بشكل عام، تقدم هذه الطريقة المبتكرة أداة واعدة لتوقع أسعار الزراعة، مما قد يساعد في اتخاذ القرارات لأصحاب المصلحة في قطاع الزراعة.

الطرق

تحدد قسم المنهجية تصميم البحث والتقنيات التحليلية المستخدمة للتحقيق في فرضيات الدراسة. استخدم الباحثون نهجًا كميًا، حيث استخدموا طرقًا إحصائية لتحليل البيانات التي تم جمعها من عينة سكانية. تضمنت الأدوات الرئيسية الاستبيانات والتجارب، التي تم تصميمها لقياس متغيرات محددة ذات صلة بأسئلة البحث.

تم إجراء تحليل البيانات باستخدام أدوات برمجية سهلت تطبيق اختبارات إحصائية متنوعة، بما في ذلك تحليل الانحدار وANOVA، لتحديد أهمية النتائج. كما تؤكد المنهجية على أهمية ضمان الموثوقية والصلاحية من خلال الاختبار الدقيق والمعايرة للأدوات المستخدمة. بشكل عام، تم هيكلة الإطار المنهجي لتوفير أساس قوي لاستنتاج النتائج من البيانات، مما يعزز مصداقية نتائج البحث.

النتائج

تظهر نتائج الدراسة أن نموذج VMD-LSTM المحسن بواسطة GA يتفوق بشكل كبير على نماذج LSTM التقليدية وغيرها من النماذج القائمة على التحليل (EMD-LSTM، EEMD-LSTM، CEEMDAN-LSTM) في توقع أسعار السلع الزراعية للذرة، وزيت النخيل، وزيت الصويا. تم استخدام حزم برمجية R المتاحة للجمهور مصممة لتوقع السلاسل الزمنية، وتم تقييم النماذج بناءً على مقاييس مثل خطأ النسبة المطلقة المتوسطة (MAPE)، وخطأ الجذر المتوسط التربيعي (RMSE)، والدقة الاتجاهية (Dstat). حقق نموذج VMD-LSTM أدنى قيم لـ MAPE وRMSE عبر جميع سلاسل الأسعار، مع انخفاض ملحوظ بنسبة 79.84% في MAPE و79.83% في RMSE للذرة مقارنةً بنموذج LSTM المستقل.

تشير النتائج إلى أن نهج التحليل والتجميع الذي تستخدمه النماذج الهجينة يخفف بشكل فعال من الضوضاء ويعزل الأنماط المتميزة داخل البيانات، مما يعزز دقة التنبؤ. على وجه الخصوص، أظهر نموذج VMD-LSTM قدرة تفوق على التكيف مع البيانات المزعجة وقدم تمثيلًا أكثر شمولاً للاتجاهات الأساسية من خلال قدرته على توليد وظائف الوضع الجوهرية المتعددة (IMFs). تتيح هذه القدرة نمذجة أكثر دقة لديناميكيات أسعار الزراعة المعقدة، مما يؤدي إلى تحسين أداء التنبؤ. تم تأكيد الأهمية الإحصائية للتحسينات من خلال اختبار ديبولد-مارينو، الذي أشار إلى أن جميع النماذج الهجينة تفوقت بشكل كبير على نموذج LSTM المستقل عند مستوى دلالة 1%. بشكل عام، تسلط الدراسة الضوء على مزايا استخدام VMD-LSTM للتنبؤات الدقيقة والموثوقة في الأسواق الزراعية المتقلبة.

المناقشة

تناقش البحث نموذجًا جديدًا للتنبؤ بأسعار الزراعة يدمج تحليل الوضع المتغير (VMD) المحسن بواسطة خوارزمية جينية (GA) مع شبكة الذاكرة طويلة وقصيرة المدى (LSTM). يتم تسليط الضوء على VMD لقدرته على استخراج وظائف الوضع الجوهرية (IMFs) من بيانات معقدة وغير ثابتة، مما يوفر مزايا مثل القوة ضد الضوضاء ودقة محسنة في التعامل مع الإشارات متعددة الترددات. يستخدم النموذج نهجًا منهجيًا لتحسين أربعة معلمات رئيسية لـ VMD – عدد الأوضاع ($n$)، ومعامل التوازن ($\alpha$)، وحدود التقارب ($\tau$)، وخطوة الصعود المزدوج ($\epsilon$) – باستخدام خوارزمية جينية لتقليل خسارة التحليل. يعزز هذا التحسين دقة التحليل، مما يسمح بنمذجة أفضل للاتجاهات الأساسية في بيانات أسعار الزراعة.

بعد ذلك، يتم نمذجة كل IMF بشكل فردي باستخدام LSTM المحسن بواسطة GA، والذي يلتقط بشكل فعال الاعتماديات طويلة الأجل والعلاقات غير الخطية داخل البيانات. يتم تحقيق التنبؤ التجميعي من خلال جمع توقعات جميع IMFs، مما يؤدي إلى إعادة بناء أكثر دقة لسلسلة الأسعار الأصلية. يتم تقييم أداء النموذج مقارنةً بالطرق التقليدية باستخدام مقاييس متنوعة، بما في ذلك خطأ الجذر المتوسط التربيعي (RMSE) وخطأ النسبة المطلقة المتوسطة (MAPE)، مما يظهر دقة تنبؤ متفوقة. بشكل عام، يمثل نموذج VMD-LSTM المحسن بواسطة GA تقدمًا كبيرًا في توقع أسعار الزراعة، مستفيدًا من تقنيات التحليل والتجميع لتعزيز الأداء التنبؤي.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-94173-0
PMID: https://pubmed.ncbi.nlm.nih.gov/40121306
Publication Date: 2025-03-22
Author(s): Kapil Choudhary et al.
Primary Topic: Stock Market Forecasting Methods

Overview

The research paper presents a novel hybrid forecasting model, termed VMD-LSTM, designed to enhance the accuracy of agricultural commodity price predictions. Traditional models often struggle with the nonlinear and nonstationary characteristics of price data, leading to suboptimal forecasts. The VMD-LSTM model integrates a genetic algorithm (GA) with variational mode decomposition (VMD) and long short-term memory (LSTM) networks. This approach first employs GA-optimized VMD to decompose price series into intrinsic mode functions (IMFs), which exhibit sparsity and facilitate faster convergence. Each IMF is then forecasted using GA-optimized LSTM models, and the individual forecasts are ensembled to generate a comprehensive prediction for the actual price series.

The performance of the VMD-LSTM model is rigorously evaluated against individual LSTM and other decomposition-based models (EMD-LSTM, EEMD-LSTM, CEEMDAN-LSTM) using monthly price data for maize, palm oil, and soybean oil. The results indicate significant improvements in forecasting accuracy, with reductions in root mean square error (RMSE) by 56.93%, 21.83%, and 27.00%, and mean absolute percentage error (MAPE) by 44%, 21.67%, and 25.85% for maize, palm oil, and soybean oil, respectively, compared to the next best model, CEEMDAN-LSTM. Additional validation through TOPSIS and the Diebold-Mariano test further confirms the superior predictive capability of the VMD-LSTM model. Overall, this innovative approach offers a promising tool for agricultural price forecasting, potentially aiding decision-making for stakeholders in the agriculture sector.

Methods

The methodology section outlines the research design and analytical techniques employed to investigate the study’s hypotheses. The researchers utilized a quantitative approach, employing statistical methods to analyze the data collected from a sample population. Key instruments included surveys and experiments, which were designed to measure specific variables relevant to the research questions.

Data analysis was conducted using software tools that facilitated the application of various statistical tests, including regression analysis and ANOVA, to determine the significance of the findings. The methodology also emphasizes the importance of ensuring reliability and validity through rigorous testing and calibration of the instruments used. Overall, the methodological framework is structured to provide a robust basis for drawing conclusions from the data, thereby enhancing the credibility of the research outcomes.

Results

The results of the study demonstrate that the GA-optimized VMD-LSTM model significantly outperforms traditional LSTM and other decomposition-based models (EMD-LSTM, EEMD-LSTM, CEEMDAN-LSTM) in forecasting agricultural prices for maize, palm oil, and soybean oil. The evaluation utilized publicly available R software packages designed for time series forecasting, and the models were assessed based on metrics such as Mean Absolute Percentage Error (MAPE), Root Mean Squared Error (RMSE), and directional accuracy (Dstat). The VMD-LSTM model achieved the lowest MAPE and RMSE values across all price series, with notable reductions of 79.84% in MAPE and 79.83% in RMSE for maize compared to the standalone LSTM model.

The findings indicate that the decomposition-and-ensemble approach employed by the hybrid models effectively mitigates noise and isolates distinct patterns within the data, enhancing predictive accuracy. Specifically, the VMD-LSTM model demonstrated superior adaptability to noisy data and provided a more comprehensive representation of the underlying trends through its ability to generate multiple Intrinsic Mode Functions (IMFs). This capability allows for a more nuanced modeling of complex agricultural price dynamics, leading to improved forecasting performance. The statistical significance of the improvements was confirmed through the Diebold-Mariano test, which indicated that all hybrid models significantly outperformed the standalone LSTM model at a 1% significance level. Overall, the study underscores the advantages of using VMD-LSTM for accurate and reliable predictions in volatile agricultural markets.

Discussion

The research discusses a novel forecasting model for agricultural prices that integrates a Genetic Algorithm (GA)-optimized Variational Mode Decomposition (VMD) with a Long Short-Term Memory (LSTM) network. VMD is highlighted for its ability to extract intrinsic mode functions (IMFs) from complex, nonstationary data, offering advantages such as robustness to noise and improved accuracy in handling multi-frequency signals. The model employs a systematic approach to optimize four key hyperparameters of VMD—number of modes ($n$), balancing parameter ($\alpha$), convergence tolerance ($\tau$), and dual ascent time-step ($\epsilon$)—using a genetic algorithm to minimize decomposition loss. This optimization enhances the precision of the decomposition, allowing for better modeling of the underlying trends in agricultural price data.

Subsequently, each IMF is modeled individually using a GA-optimized LSTM, which effectively captures long-term dependencies and nonlinear relationships within the data. The ensemble prediction is achieved by summing the forecasts of all IMFs, leading to a more accurate reconstruction of the original price series. The model’s performance is evaluated against traditional methods using various metrics, including Root Mean Squared Error (RMSE) and Mean Absolute Percentage Error (MAPE), demonstrating superior forecasting accuracy. Overall, the proposed GA-optimized VMD-LSTM model represents a significant advancement in agricultural price forecasting, leveraging decomposition and ensemble techniques to enhance predictive performance.