بيانات توزيع سجل تيار رايلي: التقدير والتنبؤ مع تطبيق على البيانات الصناعية في المملكة العربية السعودية
Rayleigh Current Record Distributed Data: Estimation and Prediction with Application on Saudi Arabia Industrial Data

المجلة: Journal of Statistical Theory and Applications، المجلد: 25، العدد: 1
DOI: https://doi.org/10.1007/s44199-025-00150-x
تاريخ النشر: 2026-01-08
المؤلف: Ramy Aldallal
الموضوع الرئيسي: تقدير التوزيع الإحصائي وتطبيقاته

نظرة عامة

في هذه الدراسة، يبحث المؤلفون في سلوك بيانات السجلات الحالية المستمدة من توزيع رايلي. تتيح طريقة السجل الحالي تتبع السجلات العليا والدنيا في وقت واحد، وتحديثها بشكل مستقل لاشتقاق نطاق السجل. يقدم البحث تعبيرات مغلقة الشكل لدوال التوزيع التراكمي (CDFs) ودوال كثافة الاحتمال (PDFs) لكل من السجلات العليا والدنيا الحالية. بالإضافة إلى ذلك، يقدم المؤلفون صيغًا بسيطة لتقدير المعلمات ويطورون خوارزمية للتنبؤ تهدف إلى تعزيز قابلية تطبيق نتائجهم.

تظهر النتائج من كل من مجموعات البيانات المحاكاة والحقيقية، تحديدًا من القطاع الصناعي في المملكة العربية السعودية، فعالية الصيغ المقترحة للحظات، تقدير المعلمات، وفترات التنبؤ. يُلاحظ أن التعبيرات المغلقة الشكل لدوال الكثافة الاحتمالية ودوال التوزيع التراكمي للسجلات الحالية مفيدة بشكل خاص للبحوث المستقبلية، حيث توفر أشكالًا سهلة الوصول وموجزة. تشير النتائج إلى إمكانيات كبيرة للتطبيق في القطاعات الصناعية والطاقة في السعودية، مما يمكّن صانعي القرار من إجراء تنبؤات مستنيرة حول القيم المستقبلية.

مقدمة

تناقش مقدمة هذه الورقة البحثية مفهوم قيم السجلات، والذي يتضمن تحديد وتخزين الأرقام التي تكون إما أكبر (سجلات عليا) أو أقل (سجلات دنيا) من جميع القيم التي تم ملاحظتها سابقًا. تسلط الورقة الضوء على أهمية توسيع النماذج الإحصائية الكلاسيكية، مثل توزيع رايلي، لالتقاط السلوكيات المعقدة بشكل أفضل وتحسين القدرات التنبؤية في البيانات الواقعية. تشير إلى الأعمال الأساسية التي قام بها أحن الله وآخرون وتطبيقات من قبل جيل وبهاتي، والتي تظهر فعالية إحصائيات نوع السجل في نمذجة الظواهر الصناعية والتشغيلية.

يقترح المؤلفون منهجية جديدة لتقدير دالة التوزيع التراكمي (CDF) ودالة كثافة الاحتمال (PDF) لكل من السجلات العليا والدنيا الحالية، بالإضافة إلى خوارزمية للتنبؤ بالقيم المستقبلية ضمن نطاق السجل. يقدمون تعبيرات مغلقة الشكل لدالة الكثافة الاحتمالية، دالة التوزيع التراكمي، ودالة الكثافة الاحتمالية المشتركة لتوزيعات سجلات رايلي الحالية، مما يبسط الصيغ السابقة من خلال القضاء على مكونات الجمع واللوغاريتم. تؤسس الورقة تعريفات للسجلات الدنيا الحالية ($L_{C_n}$) والسجلات العليا الحالية ($U_{C_n}$)، وتقدم مفهوم تغطية السجل، المحدد على أنه الفترة $(L_{C_n}, U_{C_n})$. النتائج ذات صلة خاصة بمجموعات البيانات التي تتبع توزيع رايلي، والذي هو شائع في البيانات الصناعية والطاقة في المملكة العربية السعودية.

مناقشة

في هذا القسم، يناقش المؤلفون الوظائف الأساسية والنتائج المتعلقة بالتحليل الإحصائي للسجلات الحالية المستمدة من بيانات موزعة وفق توزيع رايلي. تشمل الوظائف الرئيسية دالة غاما غير المكتملة $\gamma(m, z)$، دالة غاما السفلى المنظمة $P(m, z)$، ودالة غاما العليا المنظمة $Q(m, z)$. يستنتج المؤلفون دالة التوزيع التراكمي (CDF) ودالة كثافة الاحتمال (PDF) لكل من السجلات العليا والدنيا الحالية، ويقدمون صيغًا صريحة لهذه التوزيعات (النظريتان 1 و2). يؤكدون على أهمية هذه الوظائف في الاستدلال الإحصائي، مما يسمح بحساب الاحتمالات وتحديد أنماط البيانات.

يستكشف القسم أيضًا لحظات السجلات الحالية، مقدمًا صيغًا لحساب اللحظة $r$-th لكل من السجلات الدنيا والعليا الحالية (النظرية 3). يبرز المؤلفون أهمية هذه اللحظات في فهم خصائص التوزيع. بالإضافة إلى ذلك، يحددون منهجية لتقدير معلمات التوزيع والتنبؤ بالسجلات الحالية المستقبلية، والتي لم يتم دراستها بشكل موسع سابقًا. يتحقق المؤلفون من نتائجهم من خلال دراسة محاكاة وتحليل بيانات حقيقية، مما يظهر فعالية طرقهم المقترحة في تقديم تنبؤات دقيقة ورؤى لصنع القرار في السياقات الصناعية. تشير النتائج إلى أن الصيغ المستنتجة وتقنيات التقدير قوية ويمكن أن تساعد بشكل كبير في التحليلات الإحصائية المستقبلية للبيانات الموزعة وفق توزيع رايلي.

Journal: Journal of Statistical Theory and Applications, Volume: 25, Issue: 1
DOI: https://doi.org/10.1007/s44199-025-00150-x
Publication Date: 2026-01-08
Author(s): Ramy Aldallal
Primary Topic: Statistical Distribution Estimation and Applications

Overview

In this study, the authors investigate the behavior of current record data derived from a Rayleigh distribution. The current record method allows for simultaneous tracking of upper and lower records, updating them independently to derive the record range. The paper presents closed-form expressions for the cumulative distribution functions (CDFs) and probability density functions (PDFs) of both upper and lower current records. Additionally, the authors introduce straightforward formulas for parameter estimation and develop a prediction algorithm aimed at enhancing the applicability of their findings.

The results from both simulated and real datasets, specifically from Saudi Arabia’s industrial sector, demonstrate the effectiveness of the proposed formulas for moments, parameter estimation, and prediction intervals. The closed-form expressions for the PDFs and CDFs of the current records are noted to be particularly beneficial for future research, providing accessible and concise forms. The findings suggest significant potential for application in the Saudi industrial and energy sectors, enabling decision-makers to make informed predictions about future values.

Introduction

The introduction of this research paper discusses the concept of record values, which involves identifying and storing numbers that are either greater (upper records) or lesser (lower records) than all previously observed values. The paper highlights the significance of expanding classical statistical models, such as the Rayleigh distribution, to better capture complex behaviors and improve predictive capabilities in real-world data. It references foundational works by Ahsanullah et al. and applications by Gill and Bhatti, which demonstrate the effectiveness of record-type statistics in modeling industrial and operational phenomena.

The authors propose a novel methodology for estimating the cumulative distribution function (CDF) and probability density function (PDF) for both upper and lower current records, along with an algorithm for predicting future values within the record range. They provide closed-form expressions for the PDF, CDF, and joint PDF of Rayleigh current record distributions, simplifying previous formulations by eliminating summation and logarithmic components. The paper establishes definitions for lower current records ($L_{C_n}$) and upper current records ($U_{C_n}$), and introduces the concept of record coverage, defined as the interval $(L_{C_n}, U_{C_n})$. The findings are particularly relevant for datasets following the Rayleigh distribution, which is common in Saudi Arabian industrial and energy data.

Discussion

In this section, the authors discuss the foundational functions and results related to the statistical analysis of current records derived from Rayleigh-distributed data. Key functions include the incomplete Gamma function $\gamma(m, z)$, the regularized lower Gamma function $P(m, z)$, and the regularized upper Gamma function $Q(m, z)$. The authors derive the cumulative distribution function (CDF) and probability density function (PDF) for both upper and lower current records, providing explicit formulas for these distributions (Theorems 1 and 2). They emphasize the importance of these functions in statistical inference, allowing for the calculation of probabilities and the identification of data patterns.

The section further explores the moments of current records, presenting formulas for calculating the $r$-th moment of both lower and upper current records (Theorem 3). The authors highlight the significance of these moments in understanding the distribution’s characteristics. Additionally, they outline a methodology for estimating the distribution’s parameters and predicting future current records, which has not been extensively studied previously. The authors validate their findings through a simulation study and real data analysis, demonstrating the effectiveness of their proposed methods in providing accurate predictions and insights for decision-making in industrial contexts. The results indicate that the derived formulas and estimation techniques are robust and can significantly aid in future statistical analyses of Rayleigh-distributed data.