تحليل البيانات الحقيقية بواسطة نموذج إحصائي جديد ذو ذيل ثقيل
Analyzing Real Data by a New Heavy-Tailed Statistical Model

المجلة: Modern Journal of Statistics، المجلد: 1، العدد: 1
DOI: https://doi.org/10.64389/mjs.2025.01108
تاريخ النشر: 2025-07-10
المؤلف: Ahmed M. Gemeay وآخرون
الموضوع الرئيسي: النمذجة البايزية والاستدلال السببي

نظرة عامة

تقدم هذه الدراسة توزيع القوة ميرا، وهو نموذج احتمالي جديد ثلاثي المعلمات مصمم لتعزيز التوزيعات الأساسية من خلال دمج معلمة تشكيل إضافية. يظهر هذا التوزيع مرونة ملحوظة في نمذجة خصائص البيانات المتنوعة، بما في ذلك الانحراف اليساري واليميني، والاتجاهات المتراجعة، والأنماط أحادية القمة، مما يجعله مناسبًا بشكل خاص للبيانات المتعلقة بالمخاطر في علم الاكتوارية وتحليلات التأمين. يقوم المؤلفون بإجراء تحليل نظري شامل، يوضح الخصائص الإحصائية الرئيسية ويؤسس إطارًا قويًا لتقدير المعلمات. يحسبون مقاييس المخاطر الحرجة، مثل القيمة المعرضة للخطر وقيمة الذيل المعرضة للخطر، من خلال محاكاة عددية واسعة، والتي تتحقق من دقة وفعالية المقدرات المقترحة. يتم توضيح التطبيق العملي لتوزيع القوة ميرا باستخدام مجموعة بيانات خسائر التأمين في العالم الحقيقي، حيث يتفوق على النماذج المعتمدة من حيث جودة الملاءمة والقدرة على التكيف.

في الختام، يقدم البحث توزيعًا احتماليًا مرنًا مستمدًا من نهج التحويل القوي، مدعومًا بفحص شامل لخصائصه الإحصائية والرياضية، بما في ذلك اللحظات، ودوال الكمية، وإحصاءات الترتيب. تقيم الدراسة طرق تقدير المعلمات المختلفة، موضحة موثوقيتها من خلال تحليلات المحاكاة. تسلط النتائج الضوء على فعالية التوزيع في التقاط ميزات البيانات الأساسية، مثل الانحراف والذيل الثقيل، مما يبرز أهميته في تقييم المخاطر والنمذجة المالية. يقترح المؤلفون أن الأبحاث المستقبلية يمكن أن تستكشف قابليته للتطبيق في مجالات أخرى، بما في ذلك البنوك والهندسة والدراسات البيئية، مع توسيع إطارها النظري أيضًا إلى السياقات متعددة المتغيرات والاستدلال بايزي.

مقدمة

في العقود الأخيرة، كان تطوير توزيعات إحصائية متنوعة يهدف إلى تعزيز المرونة من خلال دمج معلمات إضافية في النماذج الأساسية. إحدى الطرق الملحوظة هي تقنية التحويل القوي، التي تعالج بفعالية العلاقات غير الخطية داخل مجموعات البيانات المعقدة، مما يسمح بإنشاء نماذج أكثر قابلية للتكيف التي تحقق توقعات محسنة. تتيح مرونة هذه الطريقة تطبيقها عبر مجموعة واسعة من التوزيعات، مما يجعلها أداة قيمة للإحصائيين ومحللي البيانات في مجالات متنوعة. أدت التقدمات الأخيرة إلى صياغة العديد من التوزيعات الجديدة، بما في ذلك توزيعات كيز-الأسية المعدلة وتوزيعات ليندلي المعدلة، من بين أمور أخرى.

تظهر الحاجة إلى التوزيعات ذات الذيل الثقيل في مجالات مثل التأمين والاقتصاد، حيث غالبًا ما تعرض مجموعات البيانات انحرافات كبيرة عن الاتجاهات المركزية بسبب القيم الشاذة أو الذيل الثقيل. غالبًا ما تفشل التوزيعات الاحتمالية التقليدية في التقاط هذه الخصائص، مما يؤدي إلى أداء غير كافٍ للنموذج. تقدم التوزيعات ذات الذيل الثقيل مرونة محسنة في نمذجة الانحراف والكورتوز، مما يثبت فائدتها بشكل خاص في تقييم المخاطر والنمذجة المالية. تهدف هذه الورقة إلى تقديم توزيع مرن جديد، يسمى توزيع القوة ميرا (PMD)، المصمم للتطبيقات في نمذجة بيانات خسائر التأمين وتقدير التعرض للمخاطر. يتميز PMD بثلاث معلمات ويمكن أن يظهر أشكالًا متنوعة، بما في ذلك الأشكال أحادية القمة والمائلة. بالإضافة إلى ذلك، توضح الورقة اشتقاق مقاييس المخاطر الرئيسية المرتبطة بـ PMD وتقدم تحليلًا شاملاً لخصائصه الإحصائية، وتقنيات تقدير المعلمات، والتطبيقات العملية من خلال دراسات المحاكاة وأمثلة البيانات الحقيقية.

طرق

في هذا القسم، يتم مناقشة سبع طرق تقدير لحساب معلمات تشتت وضعية الاستقطاب (PMD)، تحديدًا α، δ، وβ. يبرز المؤلفون توفر تقنيات التقدير التقليدية لتحديد هذه المعلمات التوزيعية، مشيرين إلى مجموعة من الأعمال السابقة التي ساهمت في هذا المجال. تشمل الأدبيات المذكورة دراسات من مؤلفين مختلفين، مما يدل على قاعدة بحثية واسعة تدعم هذه الطرق التقديرية.

نقاش

في هذا القسم، يناقش المؤلفون صياغة وخصائص توزيع القوة المعدلة (PMD)، المستمدة من توزيع ويبل ثنائي المعلمة (TPM). يتم تعريف دالة التوزيع التراكمي (CDF) ودالة كثافة الاحتمال (PDF) لـ PMD، مما يظهر مرونته في نمذجة أشكال البيانات المختلفة، بما في ذلك التوزيعات المتزايدة، أحادية القمة، والمائلة. كما يتم تقديم دالة معدل الخطر (hrf) ودالة البقاء (SF)، مما يشير إلى أن PMD يمكن أن يظهر أشكال خطر متنوعة، مثل أشكال حوض الاستحمام وعكس-J. يوضح القسم أيضًا الخصائص الإحصائية الرئيسية، بما في ذلك اللحظات، ودوال الكمية، ودوال التوليد، والتي تعتبر ضرورية لفهم سلوك التوزيع وتطبيقه في النمذجة الإحصائية.

يشتق المؤلفون اللحظات لـ PMD، مشيرين إلى كيفية زيادة المتوسط والانحراف المعياري مع المعلمة $\alpha$، بينما ينخفض الانحراف والكورتوز. كما يناقشون أهمية اللحظات غير المكتملة في بناء منحنيات بونفوروني ولورينز، والتي تعتبر حيوية لتحليل عدم المساواة. يختتم القسم بالتركيز على مقاييس المخاطر، بما في ذلك القيمة المعرضة للخطر (VaR) وقيمة الذيل المعرضة للخطر (TVaR)، مما يوضح قابلية تطبيق PMD في علم الاكتوارية. تؤكد التحليلات التجريبية باستخدام بيانات التأمين الحقيقية فعالية PMD مقارنة بالنماذج المنافسة، مما يثبت أنه أداة قوية لتقييم المخاطر والنمذجة الإحصائية عبر مجالات متنوعة.

Journal: Modern Journal of Statistics, Volume: 1, Issue: 1
DOI: https://doi.org/10.64389/mjs.2025.01108
Publication Date: 2025-07-10
Author(s): Ahmed M. Gemeay et al.
Primary Topic: Bayesian Modeling and Causal Inference

Overview

This study introduces the power Mira distribution, a novel three-parameter probability model designed to enhance baseline distributions by incorporating an additional shaping parameter. This distribution demonstrates remarkable flexibility in modeling diverse data characteristics, including left and right skewness, declining trends, and unimodal patterns, making it particularly suitable for risk-related data in actuarial science and insurance analytics. The authors conduct a thorough theoretical analysis, detailing key statistical properties and establishing a robust framework for parameter estimation. They compute critical risk metrics, such as value-at-risk and tail value-at-risk, through extensive numerical simulations, which validate the accuracy and effectiveness of the proposed estimators. The practical application of the power Mira distribution is illustrated using a real-world insurance loss dataset, where it outperforms established models in terms of goodness-of-fit and adaptability.

In conclusion, the paper presents a flexible probability distribution derived from the power transformation approach, supported by a comprehensive examination of its statistical and mathematical properties, including moments, quantile functions, and order statistics. The study evaluates various parameter estimation methods, demonstrating their reliability through simulation analyses. The findings highlight the distribution’s effectiveness in capturing essential data features, such as skewness and heavy tails, underscoring its relevance in risk assessment and financial modeling. The authors suggest that future research could explore its applicability in other fields, including banking, engineering, and environmental studies, while also expanding its theoretical framework to multivariate contexts and Bayesian inference.

Introduction

In recent decades, the development of various statistical distributions has aimed to enhance flexibility by incorporating additional parameters into parent models. One notable method is the power transformation technique, which effectively addresses non-linear relationships within complex datasets, allowing for the creation of more adaptable models that yield improved predictions. This method’s versatility enables its application across a wide range of distributions, making it a valuable asset for statisticians and data analysts in diverse fields. Recent advancements have led to the formulation of several new distributions, including the power-modified Kies-exponential and modified Lindley distributions, among others.

The necessity for heavy-tailed distributions arises in fields such as insurance and economics, where datasets often display significant deviations from central trends due to outliers or heavy tails. Traditional probability distributions frequently fall short in capturing these characteristics, leading to inadequate model performance. Heavy-tailed distributions offer enhanced flexibility in modeling skewness and kurtosis, proving particularly useful in risk assessment and financial modeling. This paper aims to introduce a novel flexible distribution, termed the power Mira distribution (PMD), which is designed for applications in insurance loss data modeling and risk exposure estimation. The PMD features three parameters and can exhibit various shapes, including unimodal and skewed forms. Additionally, the paper outlines the derivation of key risk measures associated with the PMD and provides a comprehensive analysis of its statistical properties, parameter estimation techniques, and practical applications through simulation studies and real data examples.

Methods

In this section, seven estimation methods for calculating the parameters of Polarization Mode Dispersion (PMD), specifically α, δ, and β, are discussed. The authors highlight the availability of conventional estimating techniques for determining these distribution parameters, referencing a range of prior works that have contributed to this field. The cited literature includes studies from various authors, indicating a broad foundation of research supporting these estimation methods.

Discussion

In this section, the authors discuss the formulation and statistical properties of the Power Modified Distribution (PMD), derived from the Two-Parameter Weibull (TPM) distribution. The cumulative distribution function (CDF) and probability density function (PDF) of the PMD are defined, showcasing its flexibility in modeling various data shapes, including increasing, unimodal, and skewed distributions. The hazard rate function (hrf) and survival function (SF) are also presented, indicating that the PMD can exhibit diverse hazard shapes, such as bathtub and reverse-J forms. The section further elaborates on key statistical characteristics, including moments, quantile functions, and generating functions, which are essential for understanding the distribution’s behavior and application in statistical modeling.

The authors derive the moments of the PMD, highlighting how the mean and variance increase with the parameter $\alpha$, while skewness and kurtosis decrease. They also discuss the significance of incomplete moments in constructing the Bonferroni and Lorenz curves, which are vital for inequality analysis. The section concludes with a focus on risk measures, including Value at Risk (VaR) and Tail Value at Risk (TVaR), demonstrating the PMD’s applicability in actuarial science. Empirical analysis using real-world insurance data further validates the PMD’s effectiveness compared to competing models, establishing it as a robust tool for risk assessment and statistical modeling across various fields.