مقدر جديد قوي ذو معاملين للتغلب على القيم الشاذة والتعدد الخطي في نموذج الانحدار بواسون
New robust two-parameter estimator for overcoming outliers and multicollinearity in Poisson regression model

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-12646-8
PMID: https://pubmed.ncbi.nlm.nih.gov/40721460
تاريخ النشر: 2025-07-28
المؤلف: Hebatalla H. Mohammad وآخرون
الموضوع الرئيسي: طرق ونماذج إحصائية متقدمة

نظرة عامة

تقدم ورقة البحث مقدر بواسون قوي جديد ذو معلمين (PMT-PTE) يهدف إلى معالجة التحديات المتعلقة بالقيم الشاذة والتعدد الخطي في نماذج الانحدار بواسون (PRM). يُعرف مقدر بواسون الأقصى للاحتمالية (PMLE) بحساسيته لهذه القضايا، مما قد يؤدي إلى تقديرات غير دقيقة للمعاملات وزيادة في متوسط مربع الخطأ (MSE). بينما تم اقتراح مجموعة متنوعة من المقدرات القوية والمتحيزة لمعالجة هذه المشكلات بشكل منفصل، يجمع PMT-PTE بشكل فريد بين مقدر M المحول مع مقدر ذو معلمين، مما يوفر حلاً شاملاً.

تظهر المقارنات النظرية والمحاكاة باستخدام مونت كارلو أن PMT-PTE يتفوق بشكل كبير على المقدرات الحالية في السيناريوهات التي تتواجد فيها القيم الشاذة والتعدد الخطي. تشير النتائج إلى تقليل ثابت لمتوسط مربع الخطأ عبر ظروف مختلفة، مما يعزز فعالية المقدر. بالإضافة إلى ذلك، فإن التطبيق على مجموعة بيانات من العالم الحقيقي يعزز أيضًا النتائج النظرية والمحاكاة، مما يظهر PMT-PTE كأداة موثوقة لتحليل البيانات في ظل هذه التحديات الإحصائية الشائعة. تقترح الدراسة اتجاهات بحث مستقبلية، بما في ذلك تطبيق PMT-PTE على نماذج انحدار أخرى ومجموعات بيانات أكثر تعقيدًا، لتعزيز فائدته وفهمه في سياقات أوسع.

مناقشة

في هذا القسم، يناقش المؤلفون تطوير وتقييم مجموعة متنوعة من المقدرات المنتظمة لنماذج الانحدار بواسون (PRM) لمعالجة قضايا التعدد الخطي والقيم الشاذة. يقدمون مقدر بواسون الأقصى للاحتمالية (PMLE) وقيوده، خاصة تحت التعدد الخطي، الذي يمكن أن يزيد من تباينات المعاملات. للتخفيف من هذه القضايا، يقترحون عدة بدائل متحيزة، بما في ذلك مقدر انحدار بواسون الشوكي (PRRE) ومقدر بواسون المعدل من نوع الشوك (PMRTE)، والتي تتضمن معلمات تنظيم لتحسين استقرار التقدير. يقدم المؤلفون أيضًا مقدر قوي من النوع المعدل ذو المعلمين (PMT-TPE)، الذي يجمع بين مزايا الطرق الحالية لتعزيز الأداء في ظل وجود التعدد الخطي والقيم الشاذة.

تظهر المقارنات النظرية أن مقدر PMT-TPE يتفوق على مقدرات أخرى، بما في ذلك PMLE وPRRE وPMRTE، وفقًا لمعيار مصفوفة متوسط مربع الخطأ (MSEM). يقدم المؤلفون عدة نظريات تثبت تفوق PMT-TPE بناءً على إيجابية اختلافات مصفوفة التغاير. كما يؤكدون على أهمية اختيار معلمات التحيز المناسبة لتحقيق توازن فعال بين التحيز والتباين. تكشف التقييمات التجريبية من خلال محاكاة مونت كارلو أن المقدرات القوية، وخاصة PMT-TPE، تحقق باستمرار قيم متوسط مربع خطأ (MSE) أقل مقارنة بالمقدرات غير القوية، خاصة في السيناريوهات التي تحتوي على تلوث عالٍ بالقيم الشاذة والتعدد الخطي. تدعو النتائج إلى اعتماد تقنيات التقدير القوي في تحليلات الانحدار التي تتضمن مجموعات بيانات معقدة.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-12646-8
PMID: https://pubmed.ncbi.nlm.nih.gov/40721460
Publication Date: 2025-07-28
Author(s): Hebatalla H. Mohammad et al.
Primary Topic: Advanced Statistical Methods and Models

Overview

The research paper introduces a new robust Poisson two-parameter estimator (PMT-PTE) aimed at addressing the challenges of outliers and multicollinearity in Poisson regression models (PRM). The traditional Poisson maximum likelihood estimator (PMLE) is known for its sensitivity to these issues, which can lead to biased coefficient estimates and inflated mean squared error (MSE). While various robust and biased estimators have been proposed to tackle these problems separately, the PMT-PTE uniquely combines the transformed M-estimator with a two-parameter estimator, providing a comprehensive solution.

Theoretical comparisons and Monte Carlo simulations demonstrate that the PMT-PTE significantly outperforms existing estimators in scenarios where both outliers and multicollinearity are present. The results indicate consistent MSE minimization across different conditions, reinforcing the estimator’s effectiveness. Additionally, application to a real-world dataset further validates the theoretical and simulation findings, showcasing the PMT-PTE as a reliable tool for data analysis in the presence of these common statistical challenges. The study suggests future research directions, including the application of PMT-PTE to other regression models and more complex datasets, to enhance its utility and understanding in broader contexts.

Discussion

In this section, the authors discuss the development and evaluation of various regularized estimators for Poisson regression models (PRM) to address issues of multicollinearity and outliers. They introduce the Poisson maximum likelihood estimator (PMLE) and its limitations, particularly under multicollinearity, which can inflate parameter variances. To mitigate these issues, they propose several biased alternatives, including the Poisson ridge regression estimator (PRRE) and the Poisson modified ridge-type estimator (PMRTE), which incorporate regularization parameters to improve estimation stability. The authors further introduce the robust two-parameter modified type estimator (PMT-TPE), which combines the strengths of existing methods to enhance performance in the presence of multicollinearity and outliers.

Theoretical comparisons demonstrate that the PMT-TPE estimator outperforms other estimators, including PMLE, PRRE, and PMRTE, under the mean squared error matrix (MSEM) criterion. The authors provide several theorems that establish the superiority of PMT-TPE based on the positive definiteness of covariance matrix differences. They also emphasize the importance of selecting appropriate biasing parameters to balance bias and variance effectively. Empirical evaluations through Monte Carlo simulations reveal that robust estimators, particularly PMT-TPE, consistently yield lower mean squared error (MSE) values compared to non-robust estimators, especially in scenarios with high outlier contamination and multicollinearity. The findings advocate for the adoption of robust estimation techniques in regression analyses involving complex datasets.