نموذج انحدار أسي جديد مع طريقة تقدير محسّنة تحت التعدد الخطي
A novel unit exponential regression model with improved estimation method under multicollinearity

المجلة: Computational Statistics، المجلد: 41، العدد: 4
DOI: https://doi.org/10.1007/s00180-026-01741-7
تاريخ النشر: 2026-04-13
المؤلف: Alaa R. El-Alosey وآخرون
الموضوع الرئيسي: طرق ونماذج إحصائية متقدمة

نظرة عامة

في هذا القسم، يتناول المؤلفون التحديات المتعلقة بنمذجة المتغيرات المستجيبة المحدودة ضمن الفترة (0,1) باستخدام تحليل الانحدار. يبرزون قيود النماذج التقليدية مثل نموذج بيتا ونموذج ليندلي الوحدوي، والتي قد لا تناسب العديد من مجموعات البيانات بشكل كافٍ. للتغلب على هذه القيود، يقدم البحث نموذج الانحدار الأسي الوحدوي (UERM)، المستمد من عائلة التوزيع الأسي ذي المعاملين، والذي يوفر مرونة محسنة لنمذجة البيانات الوحدوية.

يؤكد المؤلفون على أهمية تقدير المعلمات، الذي يتم عادةً من خلال تقدير الاحتمالية القصوى (MLE). ومع ذلك، يشيرون إلى أن MLE يمكن أن يصبح غير موثوق به في وجود تعدد الارتباط بين المتغيرات التفسيرية، مما يؤدي إلى تضخم التباينات وزيادة متوسط الأخطاء المربعة. لمعالجة هذه المشكلة، يقترح البحث مقدر ليو المصمم خصيصًا لـ UERM، والذي يهدف إلى التخفيف من آثار تعدد الارتباط وتحسين دقة المعلمات. من خلال محاكاة مونت كارلو الواسعة والتطبيقات الواقعية في الصحة والهندسة، تظهر النتائج أن UERM يتفوق على النماذج الحالية في ملاءمة البيانات المحدودة، بينما يوفر مقدر ليو تقديرات معلمات أكثر موثوقية في ظل ظروف تعدد الارتباط.

مقدمة

تستعرض مقدمة ورقة البحث تطور نمذجة الانحدار، بدءًا من نموذج Gaussian الخطي وقيوده في التعامل مع الاستجابات غير Gaussian. لمعالجة هذه القضايا، تم تطوير النماذج الخطية العامة (GLMs)، مما يوفر إطارًا متعدد الاستخدامات لمختلف أنواع الاستجابات، بما في ذلك البيانات الثنائية وبيانات العد. يبرز القسم ظهور نماذج الانحدار المتخصصة، مثل نماذج الانحدار الكمي، التي تكون مفيدة بشكل خاص للبيانات المقيدة ضمن الفترة (0,1). تم اقتراح العديد من توزيعات الاحتمالات الجديدة لتحليل هذه البيانات المحدودة بشكل أفضل، بما في ذلك توزيعات بيرنباوم-ساوندرز الوحدوية وتوزيعات غاما الوحدوية، من بين أمور أخرى.

تناقش الورقة أيضًا التحديات المرتبطة بالنماذج التقليدية مثل نموذج الانحدار بيتا، خاصة في التعامل مع البيانات المنحرفة وتعدد الارتباط، مما يمكن أن يهدد موثوقية تقدير الاحتمالية القصوى (MLE). للتخفيف من هذه القضايا، يقدم المؤلفون نموذج الانحدار الأسي الوحدوي (UERM) ومقدر الانحدار الأسي الوحدوي ليو (UELRE). تم تصميم UERM للعمل ضمن النطاق [0,1) وهو بارع بشكل خاص في التعامل مع مجموعات البيانات التي تتضمن أصفار. يهدف UELRE إلى تعزيز موثوقية تقدير المعلمات في وجود تعدد الارتباط. تعد الدراسة بتوضيح فعالية هذه النماذج الجديدة من خلال المحاكاة والتطبيقات الواقعية، مما يضعها كبدائل قوية لتحليل الانحدار في مجموعات البيانات المعقدة.

الطرق

في هذا القسم، يحدد المؤلفون الإطار المنهجي لنموذج الانحدار الأسي الوحدوي (UERM) المقترح المخصص للمتغيرات المستجيبة المحدودة. يستخدمون طريقة تقدير الاحتمالية القصوى (MLE) لتقدير المعلمات، مما يضمن استنتاجًا إحصائيًا قويًا. بالإضافة إلى ذلك، يقدم المؤلفون مقدر ليو المصمم خصيصًا لـ UERM، والذي يعزز كفاءة التقدير والاستقرار.

علاوة على ذلك، يشيرون إلى عمل باكوش وآخرين (2023)، الذين قدموا توزيع الانحدار الأسي الوحدوي (UED)، الذي يتميز بدالة التوزيع التراكمي (CDF) الخاصة به. يدعم هذا العمل الأساسي الأسس النظرية لـ UERM، مما يسهل تحسين نمذجة المتغيرات المستجيبة المحدودة ضمن سياق الدراسة.

المناقشة

يقدم قسم المناقشة في الورقة صياغة وخصائص توزيع الانحدار الأسي الوحدوي (UED) الذي يتميز بدالة التوزيع التراكمي (CDF) ودالة كثافة الاحتمال (PDF). يتم تعريف UED بواسطة المعلمات $\delta$ و $\theta$، التي تؤثر على شكله وتشتته. يبرز المؤلفون مرونة UED في نمذجة البيانات الواقعية من خلال أشكال PDF المختلفة، كما هو موضح في أشكالهم. يؤكدون على فائدة دالة الكمية في توليد المتغيرات العشوائية وإجراء الانحدار الكمي، الذي يُفضل على الانحدار المتوسط بسبب قوته ضد القيم الشاذة.

يقدم القسم أيضًا نموذج الانحدار الأسي الوحدوي (UERM) ومقدر الانحدار الأسي الوحدوي ليو (UELRE) كحلول لمشاكل تعدد الارتباط في تحليل الانحدار. يتضمن UELRE معلمة انكماش $d$ لتحقيق توازن بين التحيز والتباين، مما يظهر أداءً محسنًا مقارنةً بتقدير الاحتمالية القصوى التقليدي (MLE) في السيناريوهات التي تتضمن تعدد الارتباط. يقدم المؤلفون إطارًا شاملاً لتقدير المعلمات باستخدام UERM وUELRE، بما في ذلك اشتقاق دالة اللوغاريتم الاحتمالي وتطبيق الطرق العددية للتحسين. ويخلصون إلى أن UELRE هو بديل موثوق لـ MLE، خاصة في الإعدادات عالية الأبعاد مع بيانات محدودة، كما يتضح من دراسات المحاكاة والتطبيقات الواقعية الخاصة بهم.

Journal: Computational Statistics, Volume: 41, Issue: 4
DOI: https://doi.org/10.1007/s00180-026-01741-7
Publication Date: 2026-04-13
Author(s): Alaa R. El-Alosey et al.
Primary Topic: Advanced Statistical Methods and Models

Overview

In this section, the authors address the challenges of modeling bounded response variables within the interval (0,1) using regression analysis. They highlight the limitations of traditional models such as beta and unit Lindley regression, which may not adequately fit many datasets. To overcome these limitations, the paper introduces the unit exponential regression model (UERM), derived from a two-parameter exponential distribution family, which offers enhanced flexibility for unit data modeling.

The authors emphasize the importance of parameter estimation, typically achieved through maximum likelihood estimation (MLE). However, they note that MLE can become unreliable in the presence of multicollinearity among explanatory variables, leading to inflated variances and increased mean squared errors. To address this issue, the paper proposes a Liu estimator specifically for the UERM, designed to mitigate the effects of multicollinearity and improve parameter accuracy. Through extensive Monte Carlo simulations and real-world applications in health and engineering, the findings demonstrate that the UERM outperforms existing models in fitting limited data, while the Liu estimator provides more reliable parameter estimates under multicollinearity conditions.

Introduction

The introduction of the research paper outlines the evolution of regression modeling, beginning with the linear Gaussian model and its limitations in handling non-Gaussian responses. To address these issues, Generalized Linear Models (GLMs) were developed, providing a versatile framework for various response types, including binary and count data. The section highlights the emergence of specialized regression models, such as quantile regression models, which are particularly useful for data constrained within the interval (0,1). Several new probability distributions have been proposed to better analyze such bounded data, including the unit Birnbaum-Saunders and unit gamma distributions, among others.

The paper also discusses challenges associated with traditional models like the beta regression model, particularly in dealing with skewed data and multicollinearity, which can compromise the reliability of Maximum Likelihood Estimation (MLE). To mitigate these issues, the authors introduce the unit-exponential regression model (UERM) and the unit-exponential Liu regression estimator (UELRE). The UERM is designed to operate within the range [0,1) and is particularly adept at handling datasets that include zeros. The UELRE aims to enhance parameter estimation reliability in the presence of multicollinearity. The study promises to demonstrate the efficacy of these new models through simulations and real-world applications, positioning them as robust alternatives for regression analysis in complex datasets.

Methods

In this section, the authors outline the methodological framework for their proposed Unit Exponential Regression Model (UERM) tailored for bounded response variables. They employ the Maximum Likelihood Estimation (MLE) method for parameter estimation, ensuring robust statistical inference. Additionally, the authors introduce a Liu estimator specifically designed for the UERM, which enhances both estimation efficiency and stability.

Furthermore, they reference the work of Bakouch et al. (2023), who introduced the Unit Exponential Distribution (UED), characterized by its cumulative distribution function (CDF). This foundational work supports the theoretical underpinnings of the UERM, facilitating improved modeling of bounded response variables within the context of the study.

Discussion

The discussion section of the paper presents the formulation and properties of the Unit Exponential Distribution (UED) characterized by its cumulative distribution function (CDF) and probability density function (PDF). The UED is defined by parameters $\delta$ and $\theta$, which influence its shape and dispersion. The authors highlight the flexibility of the UED in modeling real-world data through various PDF shapes, as illustrated in their figures. They emphasize the utility of the quantile function for generating random variables and conducting quantile regression, which is preferred over mean regression due to its robustness against outliers.

The section further introduces the Unit Exponential Regression Model (UERM) and the Unit Exponential Liu Regression Estimator (UELRE) as solutions to multicollinearity issues in regression analysis. The UELRE incorporates a shrinkage parameter $d$ to balance bias and variance, demonstrating improved performance over traditional maximum likelihood estimation (MLE) in scenarios with multicollinearity. The authors provide a comprehensive framework for estimating parameters using the UERM and UELRE, including the derivation of the log-likelihood function and the application of numerical methods for optimization. They conclude that the UELRE is a reliable alternative to MLE, particularly in high-dimensional settings with limited data, as evidenced by their simulation studies and real-world applications.