DOI: https://doi.org/10.1007/s12065-025-01053-7
تاريخ النشر: 2025-05-30
المؤلف: Md Abrar Jahin وآخرون
الموضوع الرئيسي: تقنيات التنبؤ وتطبيقاتها
نظرة عامة
تقدم البحث شبكة دمج البيانات متعددة القنوات (MCDFN)، وهي بنية تعلم عميق هجينة مصممة لتحسين توقعات الطلب من خلال دمج عدة أنماط بيانات. غالبًا ما تكافح طرق التوقع التقليدية مع الأنماط المعقدة بسبب التغيرات الموسمية والأحداث الخاصة، بينما تفتقر أساليب التعلم العميق إلى القابلية للتفسير. تجمع MCDFN بين الشبكات العصبية التلافيفية (CNNs) وشبكات الذاكرة طويلة وقصيرة المدى (LSTMs) ووحدات التكرار المغلقة (GRUs) لالتقاط الميزات المكانية والزمانية بشكل فعال من بيانات السلاسل الزمنية. يُظهر التقييم مقارنةً بسبعة نماذج تعلم عميق أخرى أن MCDFN تتفوق عليها بشكل كبير، حيث تحقق متوسط خطأ تربيعي (MSE) قدره 23.5738، ومتوسط خطأ تربيعي جذري (RMSE) قدره 4.8553، ومتوسط خطأ مطلق (MAE) قدره 3.9991، ومتوسط خطأ نسبي مطلق (MAPE) قدره 20.1575%. تشير إحصائية ثيل (Theil’s U) البالغة 0.1181 إلى تفوقها على طرق التوقع الساذجة، وتؤكد الاختبارات الإحصائية موثوقية توقعاتها.
على الرغم من نتائجها الواعدة، تعترف الدراسة بعدة قيود، بما في ذلك التعقيد الحسابي لـ MCDFN، والحساسية لجودة البيانات، والتحديات في القابلية للتفسير. تشمل اتجاهات البحث المستقبلية إجراء تحليلات حساسية، وتعزيز تقنيات معالجة البيانات، واستكشاف دمج MCDFN مع منهجيات متقدمة مثل آليات الانتباه والتعلم المعزز. بالإضافة إلى ذلك، قد يؤدي توسيع تطبيق MCDFN في مجالات متنوعة ودمج العوامل الخارجية إلى تعزيز دقة توقعاتها وقابليتها للتعميم. بشكل عام، يساهم هذا البحث في تقدم منهجيات توقع الطلب ويقدم إرشادات عملية لدمج MCDFN في أنظمة سلسلة التوريد الحالية.
مقدمة
تؤكد مقدمة هذه الورقة البحثية على الدور الحاسم لتوقع الطلب في إدارة سلسلة التوريد (SC)، مع تسليط الضوء على تأثيره على هوامش الربح وكفاءة العمليات. تعتبر طرق التوقع التقليدية، على الرغم من أهميتها التاريخية، غير كافية بشكل متزايد بسبب التعقيدات التي أدخلتها التغيرات الموسمية، والتجارة الإلكترونية، وعوامل أخرى. وبالتالي، اتجه الباحثون إلى تقنيات متقدمة مثل التعلم الآلي (ML) والتعلم العميق (DL) لتعزيز دقة التوقعات. على الرغم من وعود نماذج DL، لا يزال هناك فجوة ملحوظة في تطبيقها على توقع الطلب في SC، لا سيما فيما يتعلق بقابليتها للتوسع وقابلية تفسيرها.
تقترح الورقة بنية هجينة جديدة، وهي شبكة دمج البيانات متعددة القنوات (MCDFN)، التي تدمج مكونات الشبكات العصبية المختلفة—الشبكات العصبية التلافيفية (CNNs)، وشبكات الذاكرة طويلة وقصيرة المدى (LSTMs)، ووحدات التكرار المغلقة (GRUs)—لتحسين أداء التوقع. تهدف هذه البنية إلى معالجة التحديات الحالية في توقع الطلب، مثل طبيعة “الصندوق الأسود” لنماذج DL، من خلال دمج تقنيات الذكاء الاصطناعي القابلة للتفسير. يؤكد المؤلفون أن MCDFN تظهر دقة وقوة تفوق سبعة نماذج DL تم تقييمها، تم التحقق منها من خلال اختبارات إحصائية صارمة. تهدف الدراسة إلى تعزيز التطبيق العملي لتوقع الطلب في إدارة SC، مما يساهم في تحسين الكفاءات التشغيلية وتوفير التكاليف.
الطرق
توضح قسم المنهجية تنفيذ وإطار التجارب لنماذج التعلم العميق (DL)، وبشكل خاص نموذج شبكة التوقع العميق متعددة القنوات (MCDFN)، الذي يهدف إلى تحسين توقع الطلب. تبدأ العملية باستخراج البيانات من أنظمة نقاط البيع (POS) أو أنظمة تخطيط موارد المؤسسات (ERP)، مع التركيز على بيانات التاريخ والمبيعات. تشمل خطوات المعالجة المسبقة الرئيسية استخراج ميزات التاريخ إلى مكونات مثل السنة، والأسبوع، واليوم، وترميز الميزات الدورية باستخدام دوال الجيب وجيب التمام لالتقاط الأنماط الموسمية، وإضافة ميزة العطلة الثنائية لمعالجة الارتفاعات غير المنتظمة في الطلب. يتم إجراء تطبيع البيانات لتوحيد نطاقات المدخلات، تليها تقسيم مجموعة البيانات إلى مجموعات تدريب، والتحقق، والاختبار، وتوليد نوافذ منزلقة من بيانات السلاسل الزمنية لتدريب النموذج.
يستخدم نموذج MCDFN بنية متعددة القنوات تدمج الشبكات العصبية التلافيفية (CNN)، وشبكات الذاكرة طويلة وقصيرة المدى (LSTM)، ووحدات التكرار المغلقة (GRU) لمعالجة نفس بيانات المدخلات عبر مسارات مختلفة، مما يسهل استخراج ميزات متنوعة. يتم استخدام المخرجات المدمجة لهذه القنوات لتوليد توقعات الطلب، والتي تعتبر حاسمة لتحسين إدارة المخزون واستراتيجيات الطلب. علاوة على ذلك، تعزز تطبيق تقنيات الذكاء الاصطناعي القابل للتفسير (XAI)، مثل أهمية ميزات التبديل (PFI) وShapTime، قابلية تفسير توقعات النموذج، مما يعزز الثقة في عملية اتخاذ القرار الخاصة به. الآثار العملية لهذه التوقعات كبيرة، حيث تؤثر مباشرة على عمليات الموردين وأنظمة إدارة المخزون.
النتائج
في قسم النتائج، تقيم الدراسة أداء مختلف بنى التعلم العميق لتوقع الطلب باستخدام مقاييس مثل متوسط الخطأ المطلق (MAE)، ومتوسط الخطأ التربيعي (MSE)، ومتوسط الخطأ التربيعي الجذري (RMSE)، ومتوسط الخطأ النسبي المطلق (MAPE). أظهرت شبكة التوقع العميق متعددة القنوات (MCDFN) المقترحة، التي تدمج طبقات CNN وLSTM وGRU، أداءً متفوقًا، حيث حققت أدنى خسارة اختبار ودرجات تنافسية عبر جميع المقاييس. توازن هذه البنية بشكل فعال بين الدقة والتعقيد، متفوقة على النماذج التقليدية مثل Vanilla LSTM، التي كافحت مع الاعتماد الزمني وأظهرت أعلى خسارة اختبار.
كشفت التحليلات المقارنة أنه بينما كانت نماذج BiLSTM وRNN وGRU تؤدي بشكل معتدل، إلا أنها لم تتطابق مع دقة MCDFN. كانت نموذج CNN أقل أداءً في الاستفادة من الميزات المكانية، وتأخرت الشبكة المتصلة بالكامل (FCN) في دقة التوقع على الرغم من بساطتها. من الجدير بالذكر أن MCDFN حققت إحصائية ثيل (Theil’s U) قدرها 0.1181، مما يشير إلى دقة تنبؤية قوية، مع الحفاظ على أوقات استدلال فعالة (≈32 مللي ثانية) مقارنة بالنماذج الأخرى. بشكل عام، تؤكد النتائج فعالية دمج هياكل الشبكات العصبية المتنوعة لتعزيز قدرات توقع الطلب.
المناقشة
تسلط قسم المناقشة في الورقة البحثية الضوء على التقدمات الكبيرة في تطبيق التعلم العميق (DL) لتوقع الطلب ضمن إدارة سلسلة التوريد (SCM). تستعرض الأدبيات من 2017 إلى 2025، مع التأكيد على إدخال منهجيات مبتكرة مثل المحولات الزمنية المدمجة (TFT)، التي تعزز الدقة التنبؤية والقابلية للتفسير من خلال آليات مثل البوابات ونماذج الانتباه. تشير الدراسات إلى أن طرق DL، بما في ذلك ARIMA وLSTM، قد حسنت بشكل ملحوظ دقة التوقع من خلال الاستفادة من بيانات المعاملات التاريخية، مما يسهل اتخاذ قرارات أفضل في موازنة العرض والطلب.
تغطي المراجعة أيضًا نماذج هجينة مختلفة وأطر تحسين تدمج تقنيات التعلم الآلي، مما يظهر فعاليتها في التقاط الاعتماديات طويلة المدى والميزات ذات الصلة من بيانات السلاسل الزمنية. من الجدير بالذكر أن النماذج المعتمدة على الانتباه قد تم التعرف عليها لقدرتها على التركيز على مقاطع بيانات الإدخال الحرجة، مما يؤدي إلى تحسين دقة التوقع. علاوة على ذلك، فإن دمج تقنيات الذكاء الاصطناعي القابل للتفسير، مثل LIME وSHAP، يعالج الحاجة إلى الشفافية في نماذج DL، مما يعزز قابليتها للاستخدام وموثوقيتها. بشكل عام، تؤكد النتائج على الإمكانات التحولية لـ DL في تعزيز قدرات توقع الطلب عبر قطاعات متنوعة، بما في ذلك البيع بالتجزئة والطاقة والسياحة، مع معالجة التحديات المتعلقة بإمكانية الوصول إلى البيانات وقابلية تفسير النماذج.
DOI: https://doi.org/10.1007/s12065-025-01053-7
Publication Date: 2025-05-30
Author(s): Md Abrar Jahin et al.
Primary Topic: Forecasting Techniques and Applications
Overview
The research presents the Multi-Channel Data Fusion Network (MCDFN), a hybrid deep learning architecture designed to improve demand forecasting by integrating multiple data modalities. Traditional forecasting methods often struggle with complex patterns due to seasonal variability and special events, while deep learning approaches lack interpretability. MCDFN combines Convolutional Neural Networks (CNNs), Long Short-Term Memory networks (LSTMs), and Gated Recurrent Units (GRUs) to effectively capture spatial and temporal features from time series data. Benchmarking against seven other deep learning models demonstrates that MCDFN significantly outperforms them, achieving a mean squared error (MSE) of 23.5738, root mean squared error (RMSE) of 4.8553, mean absolute error (MAE) of 3.9991, and mean absolute percentage error (MAPE) of 20.1575%. Theil’s U statistic of 0.1181 indicates its superiority over naive forecasting methods, and statistical tests confirm the reliability of its predictions.
Despite its promising results, the study acknowledges several limitations, including the computational complexity of MCDFN, sensitivity to data quality, and challenges in interpretability. Future research directions include conducting sensitivity analyses, enhancing data preprocessing techniques, and exploring the integration of MCDFN with advanced methodologies such as attention mechanisms and reinforcement learning. Additionally, expanding the application of MCDFN to various domains and incorporating external factors could further enhance its forecasting accuracy and generalizability. Overall, this research contributes to the advancement of demand forecasting methodologies and offers practical guidelines for integrating MCDFN into existing supply chain systems.
Introduction
The introduction of this research paper emphasizes the critical role of demand forecasting in supply chain (SC) management, highlighting its impact on profit margins and operational efficiency. Traditional forecasting methods, while historically significant, are increasingly inadequate due to the complexities introduced by seasonal variability, e-commerce, and other factors. Consequently, researchers have turned to advanced techniques such as machine learning (ML) and deep learning (DL) to enhance forecasting accuracy. Despite the promise of DL models, there remains a notable gap in their application to SC demand forecasting, particularly regarding their scalability and interpretability.
The paper proposes a novel hybrid architecture, the Multi-Channel Data Fusion Network (MCDFN), which integrates various neural network components—Convolutional Neural Networks (CNNs), Long Short-Term Memory networks (LSTMs), and Gated Recurrent Units (GRUs)—to improve forecasting performance. This architecture aims to address existing challenges in demand forecasting, such as the “black box” nature of DL models, by incorporating explainable artificial intelligence techniques. The authors assert that the MCDFN demonstrates superior accuracy and robustness compared to seven benchmarked DL models, validated through rigorous statistical testing. The research aims to enhance the practical applicability of demand forecasting in SC management, ultimately contributing to improved operational efficiencies and cost savings.
Methods
The methodology section outlines the implementation and experimentation framework for the Deep Learning (DL) models, specifically the Multi-Channel Deep Forecasting Network (MCDFN) model, aimed at improving demand forecasting. The process begins with data extraction from point of sale (POS) systems or Enterprise Resource Planning (ERP) systems, focusing on date and sales data. Key preprocessing steps include date feature extraction into components such as year, week, and day, cyclic feature encoding using sine and cosine functions to capture seasonal patterns, and the addition of a binary holiday feature to address irregular demand spikes. Data normalization is performed to standardize input ranges, followed by partitioning the dataset into training, validation, and test sets, and generating sliding windows of time series data for model training.
The MCDFN model employs a multi-channel architecture that integrates Convolutional Neural Networks (CNN), Long Short-Term Memory networks (LSTM), and Gated Recurrent Units (GRU) to process the same input data through different pathways, facilitating the extraction of diverse features. The fused outputs of these channels are utilized to generate demand forecasts, which are critical for optimizing inventory management and order strategies. Furthermore, the application of Explainable Artificial Intelligence (XAI) techniques, such as Permutation Feature Importance (PFI) and ShapTime, enhances the interpretability of the model’s predictions, thereby fostering trust in its decision-making process. The practical implications of these forecasts are significant, as they directly influence supplier operations and inventory management systems.
Results
In the results section, the study evaluates the performance of various deep learning architectures for demand forecasting using metrics such as Mean Absolute Error (MAE), Mean Squared Error (MSE), Root Mean Squared Error (RMSE), and Mean Absolute Percentage Error (MAPE). The proposed Multi-Channel Deep Forecasting Network (MCDFN), which integrates CNN, LSTM, and GRU layers, demonstrated superior performance, achieving the lowest test loss and competitive scores across all metrics. This architecture effectively balances accuracy and complexity, outperforming traditional models like Vanilla LSTM, which struggled with temporal dependencies and exhibited the highest test loss.
Comparative analysis revealed that while BiLSTM, RNN, and GRU models performed moderately, they did not match the accuracy of MCDFN. The CNN model underperformed in leveraging spatial features, and the Fully Connected Network (FCN) lagged in forecasting accuracy despite its simplicity. Notably, MCDFN achieved a Theil’s U statistic of 0.1181, indicating robust predictive accuracy, while maintaining efficient inference times (≈32 ms) compared to other models. Overall, the findings underscore the effectiveness of combining diverse neural network structures for enhanced demand forecasting capabilities.
Discussion
The discussion section of the research paper highlights significant advancements in the application of deep learning (DL) for demand forecasting within supply chain management (SCM). It reviews literature from 2017 to 2025, emphasizing the introduction of innovative methodologies such as Temporal Fusion Transformers (TFT), which enhance predictive accuracy and interpretability through mechanisms like gating and attention models. Studies indicate that DL methods, including ARIMA and LSTM, have markedly improved forecasting accuracy by leveraging historical transaction data, thereby facilitating better decision-making in balancing supply and demand.
The review also covers various hybrid models and optimization frameworks that integrate machine learning techniques, showcasing their effectiveness in capturing long-term dependencies and relevant features from time series data. Notably, attention-based models have been recognized for their ability to focus on critical input data segments, leading to improved forecast accuracy. Furthermore, the incorporation of explainable AI techniques, such as LIME and SHAP, addresses the need for transparency in DL models, enhancing their usability and trustworthiness. Overall, the findings underscore the transformative potential of DL in enhancing demand forecasting capabilities across diverse sectors, including retail, energy, and tourism, while also addressing challenges related to data accessibility and model interpretability.
