DOI: https://doi.org/10.1007/s42519-026-00549-4
تاريخ النشر: 2026-02-05
المؤلف: Rose Baker
الموضوع الرئيسي: تقدير التوزيع الإحصائي وتطبيقاته
نظرة عامة
تقدم البحث توزيع GGL المعمم (GGL)، وهو امتداد جديد لتوزيع شامبرنو، الذي يعد توزيعًا لوغاريتميًا عامًا قادرًا على نمذجة البيانات عبر الخط الحقيقي بالكامل، بما في ذلك مجموعات البيانات ذات الذيل الطويل والثنائي القمة. يتميز توزيع GGL ببساطته في الحساب، مما يسهل توليد الأرقام العشوائية، وحساب الكوانتيلات، وتقييم الخسائر المتوقعة. يظهر أداءً Comparable لتوزيع t للبيانات ذات الذيل الطويل مع الحفاظ على وجود جميع اللحظات ودالة توليد اللحظات، مما يوفر ميزة كبيرة على توزيع شامبرنو.
تشير النتائج إلى أن توزيع GGL لا يناسب البيانات ذات الذيل الطويل بشكل فعال فحسب، بل يقارب أيضًا التوزيع الطبيعي ويستوعب البيانات ذات الذيل القصير والثنائي القمة، مما يمكّن الاختبارات البارامترية للثنائية القمة. تشير العلاقة بين توزيع GGL وتوزيع t إلى أن قابلية معالجة GGL قد تنبع من هذه العلاقة. كما يشير البحث إلى إمكانية استكشاف النسخ المنحرفة من توزيع GGL وتطوير توزيعات ثنائية المتغيرات باستخدام الكوبولات. بينما تم نمذجة الحسابات في فورتران، يقترح المؤلفون أن الانتقال إلى منصات أكثر استخدامًا مثل R سيكون ممكنًا، مما يعزز الوصول لمزيد من البحث والتطبيق.
مقدمة
تناقش مقدمة الورقة أهمية توزيع اللوغاريتم في ملاءمة البيانات والانحدار اللوغاريتمي، خاصة لنمذجة المتغيرات العشوائية الثنائية. تبرز الحاجة إلى تعميم هذا التوزيع من خلال تقديم معلمة إضافية، مع التركيز على التعميمات المتماثلة نظرًا لبساطتها وملاءمتها في نمذجة البيانات الواقعية التي غالبًا ما تقارب التماثل، كما تدعمه نظرية الحد المركزي. تحدد الورقة التوزيعات المعممة الموجودة، مثل توزيع اللوغاريتم من النوع الرابع وتوزيع شامبرنو، مشيرة إلى تعقيداتها وقيودها، خاصة من حيث قابلية المعالجة.
لمعالجة هذه التحديات، يقترح المؤلفون توزيع لوغاريتمي عام جديد متماثل، يُسمى توزيع اللوغاريتم المعمم الهندسي (GGL). يتميز هذا التوزيع الجديد بدالة كثافة احتمالية (pdf) ودالة توزيع أبسط، مما يجعله أكثر قابلية للإدارة للتطبيقات، بما في ذلك ملاءمة البيانات ذات الذيل الطويل والقصير. يظهر توزيع GGL خصائص فريدة، مثل كونه ثنائي القمة مع قيم معلمة سالبة، مما يتناقض مع سلوك القمة المسطحة لتوزيع شامبرنو. تهدف الورقة إلى استكشاف خصائص توزيع GGL وملاءمته لمختلف أنواع البيانات، وخاصة البيانات المالية، مع تقديم تحليل مقارن مع توزيع t وتوزيع شامبرنو. تمهد المقدمة الطريق لفحص مفصل لقدرات توزيع GGL والاستخدامات المحتملة في الانحدار اللوغاريتمي ونمذجة النمو.
مناقشة
في هذا القسم، يقدم المؤلفون توزيع لوغاريتمي عام جديد (GGL) الذي ينمذج البيانات ذات الذيل الطويل بشكل فعال، موضحين مزاياه على التوزيعات التقليدية مثل توزيع t وتوزيع شامبرنو. يتم تعريف دالة كثافة الاحتمال (pdf) على أنها
\[
f(x) = (1 – p) \frac{\exp(-x)(1 + \exp(-x))^2}{\left((1 + \exp(-x))^2 – 4p \exp(-x)\right)^{3/2}}
\]
لـ \( p < 1 \)، حيث يشير \( p \) إلى ارتفاع التوزيع أو طول الذيل. يبرز المؤلفون أنه بالنسبة لـ \( p > 0 \)، يظهر التوزيع ذيولًا أطول من توزيع اللوغاريتم، بينما بالنسبة لـ \( p < 0 \)، يكون له ذيول أقصر. اللحظات في التوزيع محدودة، مما يجعله مناسبًا للتطبيقات في نمذجة المالية، حيث تمثل اللحظات اللانهائية غالبًا تحديات. يتم التعبير عن التباين على أنه \[ \sigma^2 = \frac{\pi^2}{3} - \text{Li}_2(p), \] حيث \(\text{Li}_2\) هي دالة الديلوجاريتم، والانحراف المطلق المتوسط يُعطى بـ \[ E(|X|) = 2 \log(1 + 1 - p). \] يسمح توزيع GGL أيضًا باستكشاف الوضعية، حيث يظهر أحادية القمة لـ \( p > -2 \) وثنائية القمة لـ \( p < -2 \). يستنتج المؤلفون أن توزيع GGL لا يناسب البيانات ذات الذيل الطويل بشكل فعال فحسب، بل يقارب أيضًا التوزيع الطبيعي بشكل جيد، مما يجعله أداة متعددة الاستخدامات لنمذجة الإحصاءات. يقترحون أن العمل المستقبلي يمكن أن يستكشف المزيد من تطبيقاته في الانحدار اللوغاريتمي ونمذجة النمو، بالإضافة إلى إمكانية النسخ المنحرفة من التوزيع.
DOI: https://doi.org/10.1007/s42519-026-00549-4
Publication Date: 2026-02-05
Author(s): Rose Baker
Primary Topic: Statistical Distribution Estimation and Applications
Overview
The research introduces the Generalized GGL (GGL) distribution, a novel extension of the Champernowne distribution, which is a generalized logistic distribution adept at modeling data across the entire real line, including both long-tailed and bimodal datasets. The GGL distribution is highlighted for its simplicity in computation, facilitating random number generation, quantile calculations, and expected shortfall assessments. It demonstrates comparable performance to the t-distribution for long-tailed data while maintaining the existence of all moments and the moment-generating function, thus offering a significant advantage over the Champernowne distribution.
The findings indicate that the GGL distribution not only fits long-tailed data effectively but also approximates normality and accommodates short-tailed and bimodal data, enabling parametric tests for bimodality. The relationship between the GGL and t-distribution suggests that the tractability of the GGL may stem from this connection. The research also notes the potential for future exploration of skew versions of the GGL distribution and the development of bivariate distributions using copulas. While the computations have been prototyped in Fortran, the authors suggest that transitioning to more widely used platforms like R would be feasible, enhancing accessibility for further research and application.
Introduction
The introduction of the paper discusses the significance of the logistic distribution in data fitting and logistic regression, particularly for modeling binary random variables. It highlights the need for generalizing this distribution by introducing an additional parameter, focusing on symmetric generalizations due to their simplicity and relevance in modeling real-world data that often approximates symmetry, as supported by the central limit theorem. The paper identifies existing generalized distributions, such as the type IV logistic and the Champernowne distribution, noting their complexities and limitations, particularly in terms of tractability.
To address these challenges, the authors propose a new symmetric generalized logistic distribution, termed the geometric generalized logistic (GGL) distribution. This new distribution is characterized by a simpler probability density function (pdf) and distribution function, making it more manageable for applications, including fitting long-tailed and short-tailed data. The GGL distribution exhibits unique properties, such as becoming bimodal with negative parameter values, contrasting with the flat-topped behavior of the Champernowne distribution. The paper aims to explore the GGL distribution’s properties and its applicability to various data types, particularly financial data, while also providing a comparative analysis with the t-distribution and Champernowne distribution. The introduction sets the stage for a detailed examination of the GGL distribution’s capabilities and potential uses in logistic regression and growth modeling.
Discussion
In this section, the authors present a new generalised logistic distribution (GGL) that effectively models long-tailed data, demonstrating its advantages over traditional distributions like the t-distribution and the Champernowne distribution. The probability density function (pdf) is defined as
\[
f(x) = (1 – p) \frac{\exp(-x)(1 + \exp(-x))^2}{\left((1 + \exp(-x))^2 – 4p \exp(-x)\right)^{3/2}}
\]
for \( p < 1 \), where \( p \) indicates the distribution's peakedness or tail length. The authors highlight that for \( p > 0 \), the distribution exhibits longer tails than the logistic distribution, while for \( p < 0 \), it has shorter tails. The moments of the distribution are finite, making it suitable for applications in financial modeling, where infinite moments often pose challenges. The variance is expressed as \[ \sigma^2 = \frac{\pi^2}{3} - \text{Li}_2(p), \] where \(\text{Li}_2\) is the dilogarithm function, and the mean absolute deviation is given by \[ E(|X|) = 2 \log(1 + 1 - p). \] The GGL distribution also allows for the exploration of modality, showing unimodality for \( p > -2 \) and bimodality for \( p < -2 \). The authors conclude that the GGL distribution not only fits long-tailed data effectively but also approximates normality well, making it a versatile tool for statistical modeling. They suggest that future work could further explore its applications in logistic regression and growth modeling, as well as the potential for skewed versions of the distribution.
