DOI: https://doi.org/10.1038/s41598-025-32509-6
PMID: https://pubmed.ncbi.nlm.nih.gov/41559142
تاريخ النشر: 2026-01-20
المؤلف: Amjad Ghazai Alsulami وآخرون
الموضوع الرئيسي: جوانب متنوعة من أبحاث السياحة
نظرة عامة
تبحث هذه الدراسة في تطبيق تقنيات تعلم الآلة (ML) للتنبؤ بوصول السياح إلى المملكة العربية السعودية، وهو عنصر حاسم في مبادرة رؤية 2030 التي تهدف إلى تنويع الاقتصاد. باستخدام مجموعة بيانات على مستوى المدينة من 2021 إلى 2023، تقيم الدراسة نماذج الانحدار والنماذج التجميعية المختلفة، بما في ذلك الغابة العشوائية، وتعزيز التدرج، والتجميع والترتيب. أظهر نموذج VotingR2 التجميعي أعلى أداء تنبؤي، محققًا قيم R² تبلغ 0.9601 في تدريب السنوات المختلطة، و0.8735 في تقييم الاحتفاظ الزمني، و0.9578 في التحقق المتقاطع لسلاسل الزمن ذات 10 طيات. تسلط النتائج الضوء على فعالية الأساليب التجميعية في التقاط أنماط السياحة المعقدة وتوفر رؤى للتخطيط الاستراتيجي وتطوير البنية التحتية.
على الرغم من النتائج الواعدة، تعترف الدراسة بالقيود، مثل مجموعة البيانات الصغيرة نسبيًا واستبعاد المتغيرات الخارجية مثل أنماط التنقل والمؤشرات الاقتصادية الكلية، التي يمكن أن تعزز دقة التنبؤ. كما تؤكد البحث على الحاجة إلى مجموعات بيانات شاملة وطويلة الأجل مصممة خصيصًا لتناسب الخصائص الفريدة للسياحة في السعودية. ستركز الأعمال المستقبلية على توسيع مجموعة البيانات، ودمج ميزات خارجية إضافية، وتطوير أطر نمذجة هجينة لتحسين الواقعية التنبؤية. بشكل عام، تؤكد الدراسة على إمكانيات التنبؤ المعتمد على ML كأداة قيمة لإدارة السياحة بينما تدعو إلى تحسين مستمر ودمج بيانات أوسع لتعزيز التطبيق العملي في العالم الحقيقي.
طرق
توضح قسم منهجية البحث النهج المنهجي المستخدم للتحقيق في فرضيات الدراسة. يتناول اختيار المشاركين، وتقنيات جمع البيانات، وإجراءات التحليل. تم اختيار المشاركين بناءً على معايير إدراج محددة لضمان عينة تمثيلية ذات صلة بأسئلة البحث. شمل جمع البيانات طرقًا نوعية وكمية، باستخدام الاستبيانات والمهام التجريبية لجمع رؤى شاملة.
تضمنت إجراءات التحليل تحليلات إحصائية لتقييم العلاقات بين المتغيرات، باستخدام تقنيات مثل تحليل الانحدار وANOVA. كما تؤكد المنهجية على أهمية ضمان موثوقية وصلاحية القياسات المستخدمة، إلى جانب الاعتبارات الأخلاقية في إجراء البحث. بشكل عام، تم تصميم الأساليب المستخدمة لاختبار الفرضيات المقترحة بدقة والمساهمة في المعرفة الحالية في هذا المجال.
نتائج
يقيم قسم النتائج في ورقة البحث نماذج تعلم الآلة المختلفة المطبقة للتنبؤ وتصنيف تحركات السياح في المملكة العربية السعودية، باستخدام نهج منظم عبر سبعة سيناريوهات متميزة (A-G). تتضمن التحليلات ظروفًا تجريبية متنوعة، بما في ذلك تقسيم البيانات الزمنية، والتحقق المتقاطع، وزيادة البيانات، وتصنيف متعدد التسميات. يتم استخدام مقاييس الأداء الرئيسية مثل متوسط الخطأ المطلق (MAE)، ومتوسط الخطأ التربيعي (MSE)، ودرجات R²، والدقة، ودرجات F1 لتقييم دقة التنبؤ وقوة النماذج.
تسلط النتائج الضوء على أن الدراسات الحالية الرائدة في التنبؤ بالسياحة تواجه قيودًا كبيرة، خاصة بسبب نقص الأطر الخاصة بالسعودية التي تأخذ في الاعتبار الديناميات الفريدة للسياحة الدينية والسياحة المدفوعة بالفعاليات. بالإضافة إلى ذلك، هناك نقص ملحوظ في استخدام مجموعات البيانات المتكاملة التي يمكن أن تعزز أداء النموذج من خلال دمج المؤشرات الاجتماعية والاقتصادية، والموسمية، والمدفوعة بالفعاليات. لمعالجة هذه الفجوات، تقترح الدراسة إطارًا جديدًا للتنبؤ بتعلم الآلة التجميعي مصممًا لتلبية احتياجات الطلب السياحي في السعودية، مع دمج المؤشرات الاقتصادية، والتقويمات الدينية، والعوامل المدفوعة بالفعاليات، مما يوفر ابتكارًا منهجيًا وملاءمة سياقية في مشهد السياحة المتطور.
مناقشة
تسلط قسم المناقشة في ورقة البحث الضوء على التطبيق الناشئ لتعلم الآلة (ML) في التنبؤ بالسياحة داخل المملكة العربية السعودية، مع التأكيد على الحاجة إلى نهج أكثر تكاملاً يلتقط الديناميات المعقدة للقطاع. بينما أظهرت الدراسات السابقة، مثل تلك التي أجراها شاه وآخرون ولواطي وآخرون، نجاحات أولية في تطبيق تقنيات ML على جوانب معينة من السياحة، إلا أنها لم تطور أطرًا شاملة للتنبؤ. أثبتت النماذج الاقتصادية التقليدية، مثل ARIMA، عدم كفايتها في معالجة عدم الخطية التي أدخلتها عوامل مثل مبادرات رؤية 2030 والتفاعل الفريد للسياحة الدينية والسياحة المدفوعة بالفعاليات. وهذا يبرز فجوة تجريبية ومنهجية كبيرة تهدف الدراسة الحالية إلى سدها من خلال دمج أنواع بيانات متنوعة في نظام موحد للتنبؤ المعتمد على ML.
تستخدم الدراسة إطارًا منهجيًا قويًا يستند إلى نظرية الطلب السياحي ونموذج دورة حياة منطقة السياحة (TALC)، والذي يوجه اختيار المتنبئين وتصميم خط أنابيب التنبؤ. من خلال استخدام خوارزميات ML المختلفة، بما في ذلك الأساليب التجميعية مثل التجميع والترتيب، تهدف الدراسة إلى تعزيز دقة التنبؤ مع معالجة تعقيدات الطلب السياحي المتأثرة بالعوامل الاقتصادية والثقافية والمدفوعة بالفعاليات. تشير النتائج إلى أن النماذج التجميعية، وخاصة تكوين VotingR2، تتفوق على النماذج التقليدية، مما يظهر تفوقًا في التعميم والاستقرار في التنبؤ بتحركات السياح. لا تسهم هذه الدراسة فقط في الفهم النظري لديناميات السياحة في المملكة العربية السعودية، بل توفر أيضًا رؤى عملية لصانعي السياسات ومخططي السياحة الذين يهدفون إلى الاستفادة من الأساليب المعتمدة على البيانات للنمو المستقبلي.
DOI: https://doi.org/10.1038/s41598-025-32509-6
PMID: https://pubmed.ncbi.nlm.nih.gov/41559142
Publication Date: 2026-01-20
Author(s): Amjad Ghazai Alsulami et al.
Primary Topic: Diverse Aspects of Tourism Research
Overview
This research examines the application of machine learning (ML) techniques for forecasting tourist arrivals in Saudi Arabia, a critical component of the nation’s Vision 2030 initiative aimed at economic diversification. Utilizing a city-level dataset from 2021 to 2023, the study evaluates various regression and ensemble models, including Random Forest, Gradient Boosting, and combinatorial stacking and voting ensembles. The VotingR2 ensemble model demonstrated the highest predictive performance, achieving R² values of 0.9601 in mixed-year training, 0.8735 in temporal holdout evaluation, and 0.9578 in 10-fold time series cross-validation. The findings highlight the effectiveness of ensemble methods in capturing complex tourism patterns and provide insights for strategic planning and infrastructure development.
Despite the promising results, the study acknowledges limitations, such as the relatively small dataset and the exclusion of external variables like mobility patterns and macroeconomic indicators, which could enhance forecasting accuracy. The research also emphasizes the need for comprehensive, long-term datasets tailored to the unique characteristics of Saudi tourism. Future work will focus on expanding the dataset, integrating additional external features, and developing hybrid modeling frameworks to improve predictive realism. Overall, the study underscores the potential of ML-based forecasting as a valuable tool for tourism management while advocating for continuous refinement and broader data integration to enhance real-world applicability.
Methods
The research methodology section outlines the systematic approach employed to investigate the study’s hypotheses. It details the selection of participants, data collection techniques, and analytical procedures. Participants were chosen based on specific inclusion criteria to ensure a representative sample relevant to the research questions. Data collection involved both qualitative and quantitative methods, utilizing surveys and experimental tasks to gather comprehensive insights.
Analytical procedures included statistical analyses to evaluate the relationships between variables, employing techniques such as regression analysis and ANOVA. The methodology also emphasizes the importance of ensuring reliability and validity in the measurements used, alongside ethical considerations in conducting the research. Overall, the methods employed are designed to rigorously test the proposed hypotheses and contribute to the existing body of knowledge in the field.
Results
The results section of the research paper evaluates various machine learning models applied to forecast and classify tourist movements in Saudi Arabia, utilizing a structured approach across seven distinct scenarios (A-G). The analysis incorporates diverse experimental conditions, including temporal data splits, cross-validation, data augmentation, and multi-label classification. Key performance metrics such as Mean Absolute Error (MAE), Mean Squared Error (MSE), R² scores, precision, and F1-scores are employed to assess the predictive accuracy and robustness of the models.
The findings highlight that current state-of-the-art studies in tourism forecasting face significant limitations, particularly due to the lack of Saudi-specific frameworks that account for the unique dynamics of religious and event-driven tourism. Additionally, there is a noted underutilization of integrated datasets that could enhance model performance by incorporating socio-economic, seasonal, and event-based indicators. To address these gaps, the research proposes a novel ensemble machine learning forecasting framework tailored to Saudi Arabia’s tourism demand, integrating economic indicators, religious calendars, and event-driven factors, thereby offering both methodological innovation and contextual relevance in the evolving tourism landscape.
Discussion
The discussion section of the research paper highlights the emerging application of machine learning (ML) in tourism forecasting within Saudi Arabia, emphasizing the need for a more integrated approach that captures the complex dynamics of the sector. While previous studies, such as those by Shah et al. and Louati et al., have demonstrated initial successes in applying ML techniques to specific aspects of tourism, they have not developed comprehensive forecasting frameworks. Traditional econometric models, like ARIMA, have proven inadequate in addressing the nonlinearities introduced by factors such as Vision 2030 initiatives and the unique interplay of religious and event-driven tourism. This underscores a significant empirical and methodological gap that the current study aims to fill by integrating diverse data types into a unified ML-based forecasting system.
The study employs a robust methodological framework grounded in tourism demand theory and the Tourism Area Life Cycle (TALC) model, which informs the selection of predictors and the design of the forecasting pipeline. By utilizing various ML algorithms, including ensemble methods like stacking and voting, the research aims to enhance predictive accuracy while addressing the complexities of tourism demand influenced by economic, cultural, and event-driven factors. The findings indicate that ensemble models, particularly the VotingR2 configuration, outperform traditional models, demonstrating superior generalization and stability in forecasting tourist movements. This research not only contributes to the theoretical understanding of tourism dynamics in Saudi Arabia but also provides practical insights for policymakers and tourism planners aiming to leverage data-driven approaches for future growth.
