تقدير قوي لتوزيع وايبل ذو الثلاثة معلمات لمعالجة القيم الشاذة في تحليل الموثوقية Robust estimation of the three parameter Weibull distribution for addressing outliers in reliability analysis

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-96043-1
PMID: https://pubmed.ncbi.nlm.nih.gov/40181061
تاريخ النشر: 2025-04-03
المؤلف: Muhammad Aslam Mohd Safari وآخرون
الموضوع الرئيسي: تصميم هندسي احتمالي وقوي

نظرة عامة

تقدم البحث تقنية تقدير قوية جديدة لتوزيع ويبل ذو الثلاثة معلمات، معالجًا التحديات التي تطرحها القيم الشاذة في النمذجة الإحصائية وتحليل الموثوقية. الطريقة المقترحة، التي تُسمى مُقدّر تحويل التكامل الاحتمالي (PITE)، تستخدم دالة البقاء لتوزيع ويبل لتعزيز القوة مع ضمان البساطة الحسابية. تُظهر دراسات المحاكاة الواسعة أن PITE تُحسن بشكل كبير دقة تقديرات المعلمات في وجود القيم الشاذة مقارنةً بالطرق التقليدية مثل تقدير الاحتمالية القصوى (MLE) وطريقة اللحظات (MOM). بالإضافة إلى ذلك، تؤكد تطبيقات PITE على مجموعات بيانات الموثوقية في العالم الحقيقي فعاليتها العملية.

بينما يتفوق PITE في السيناريوهات المعرضة للقيم الشاذة، فإن كفاءته تتناقص في مجموعات البيانات النظيفة، خاصة عندما تكون معلمة الشكل لتوزيع ويبل صغيرة. على الرغم من هذه القيود، يتفوق PITE باستمرار على تقنيات التقدير الأخرى ويوفر أفضل ملاءمة بين مختلف توزيعات الثلاثة معلمات التي تم تقييمها، بما في ذلك ويبل الموسع، ويبل الممتد، وويبل غاما. تسلط الدراسة الضوء على القوة وقابلية تطبيق PITE في نمذجة بيانات الموثوقية، بينما تحدد أيضًا مجالات البحث المستقبلية، بما في ذلك توسيع نطاقه ليشمل نماذج إحصائية أوسع وتحسين التعامل مع البيانات المقيدة.

النتائج

تظهر النتائج من محاكيات مونت كارلو، كما هو موضح في الشكل 4، عدة نتائج رئيسية تتعلق بأداء مختلف المقدّرين بالنسبة لحجم العينة، ومعلمة الشكل، ووجود القيم الشاذة. أولاً، يرتبط زيادة حجم العينة بانخفاض كل من خطأ الجذر التربيعي المتوسط (RMSE) وقيم Def عبر جميع المقدّرين، مما يشير إلى تحسين الدقة في تقديرات المعلمات. على العكس، مع زيادة معلمة الشكل ($\theta$)، يظهر معظم المقدّرين تراجعًا في الأداء، مما ينعكس في ارتفاع قيم RMSE وDef، مما يشير إلى أن المعلمات الشكل الأعلى تعقد التقدير، خاصة في وجود القيم الشاذة.

على وجه التحديد، بالنسبة لمعلمة الشكل (الشكل 4(أ))، يتفوق مقدّرو الوقت المتكامل المعتمد (PITEs)، ولا سيما PITE ($\rho = 0.68$ و$\rho = 1.00$)، باستمرار على تقدير الاحتمالية القصوى (MLE)، وتقدير الاحتمالية القصوى الموزونة (WMLE)، وطريقة اللحظات (MOM)، وطريقة تقدير المعلمات (MPSE) من حيث قيم RMSE الأقل، مما يظهر القوة ضد القيم الشاذة. بالنسبة لمعلمة المقياس (الشكل 4(ب))، تحافظ PITEs على أداء مستقر عبر نسب القيم الشاذة المتغيرة، بينما يتفوق MPSE بشكل خاص عندما تكون معلمة الشكل كبيرة. من حيث معلمة الموقع (الشكل 4(ج))، تُظهر PITEs مرة أخرى أداءً متفوقًا، خاصة PITE ($\rho = 1.00$)، مقارنةً بـ MLE وMPSE، بينما تسجل MOM باستمرار أعلى قيم RMSE، مما يشير إلى أقل دقة. بشكل عام، بناءً على معيار Def (الشكل 4(د))، تظهر PITEs كأكثر المقدّرين فعالية، مع ظهور MOM بأداء ضعيف عبر جميع المقاييس.

المناقشة

تقدم قسم المناقشة في الورقة تحليلًا شاملاً لتوزيع ويبل ذو الثلاثة معلمات، مع التركيز على تقدير المعلمات القوي باستخدام طريقة جديدة تُسمى مُقدّر تحويل التكامل الاحتمالي (PITE). تلعب المعلمات الثلاث—الشكل ($\theta$)، المقياس ($\beta$)، والموقع ($\gamma$)—أدوارًا حاسمة في تحديد خصائص التوزيع، بما في ذلك سلوك الشيخوخة ومرونة النمذجة في السيناريوهات الواقعية. تسلط الورقة الضوء على كيفية تأثير تغيير $\theta$ على ملف التوزيع، مع تداعيات على مقاييس الموثوقية مثل متوسط الوقت حتى الفشل (MTTF)، ودالة البقاء، ودالة معدل الفشل. يسمح إدخال معلمة $\gamma$ بتأخير زمني في بدء الشيخوخة، مما يعزز قابلية تطبيق النموذج.

تُقدم طريقة PITE كمقدّر قوي يقلل من تأثير القيم الشاذة من خلال تحويل البيانات إلى توزيع موحد قياسي. يناقش القسم كفاءة المقدّر النسبية الأسيمتوتية (ARE) مقارنةً بمقدّر الاحتمالية القصوى (MLE)، كاشفًا أن PITE يتفوق عمومًا على MLE، خاصة في مجموعات البيانات التي تحتوي على قيم شاذة. تُظهر محاكيات مونت كارلو اتساق PITE وحساسيته، مما يُظهر أنه يتقارب إلى القيم الحقيقية للمعلمات حتى في وجود القيم الشاذة. تشير النتائج إلى أنه بينما يتفوق PITE في مجموعات البيانات المعرضة للقيم الشاذة، قد تكون الطرق التقليدية مثل MLE أكثر فعالية لمجموعات البيانات النظيفة. تختتم الورقة بالتأكيد على القوة والمزايا العملية لـ PITE، بينما تشير أيضًا إلى الحاجة إلى ضبط دقيق للمعلمة $\rho$ لتحسين الأداء بناءً على خصائص مجموعة البيانات. ستهدف الأبحاث المستقبلية إلى توسيع قابلية تطبيق PITE لتشمل نماذج إحصائية أوسع وتعزيز تعاملها مع البيانات المقيدة.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-96043-1
PMID: https://pubmed.ncbi.nlm.nih.gov/40181061
Publication Date: 2025-04-03
Author(s): Muhammad Aslam Mohd Safari et al.
Primary Topic: Probabilistic and Robust Engineering Design

Overview

The research presents a novel robust estimation technique for the three-parameter Weibull distribution, addressing the challenges posed by outliers in statistical modeling and reliability analysis. The proposed method, termed Probability Integral Transform Estimator (PITE), utilizes the Weibull survival function to enhance robustness while ensuring computational simplicity. Extensive simulation studies demonstrate that PITE significantly improves the accuracy of parameter estimates in the presence of outliers compared to traditional methods such as Maximum Likelihood Estimation (MLE) and Method of Moments (MOM). Additionally, the application of PITE to real-world reliability datasets confirms its practical effectiveness.

While PITE excels in outlier-prone scenarios, its efficiency diminishes in cleaner datasets, particularly when the shape parameter of the Weibull distribution is small. Despite this limitation, PITE consistently outperforms other estimation techniques and provides the best fit among various three-parameter distributions evaluated, including Exp Weibull, Ext Weibull, and Gamma Weibull. The study highlights the robustness and applicability of PITE in modeling reliability data, while also identifying avenues for future research, including its extension to broader statistical models and improved handling of censored data.

Results

The results from the Monte Carlo simulations, as illustrated in Figure 4, reveal several key findings regarding the performance of various estimators in relation to sample size, shape parameter, and outlier presence. Firstly, an increase in sample size correlates with a decrease in both Root Mean Square Error (RMSE) and Def values across all estimators, indicating enhanced accuracy in parameter estimates. Conversely, as the shape parameter ($\theta$) increases, most estimators exhibit a decline in performance, reflected by rising RMSE and Def values, suggesting that higher shape parameters complicate estimation, particularly in the presence of outliers.

Specifically, for the shape parameter (Figure 4(a)), Parameterized Integrated Time Estimators (PITEs), notably PITE ($\rho = 0.68$ and $\rho = 1.00$), consistently outperform Maximum Likelihood Estimation (MLE), Weighted Maximum Likelihood Estimation (WMLE), Method of Moments (MOM), and Method of Parameter Estimation (MPSE) in terms of lower RMSE values, demonstrating robustness against outliers. For the scale parameter (Figure 4(b)), PITEs maintain stable performance across varying outlier percentages, while MPSE excels particularly when the shape parameter is large. In terms of the location parameter (Figure 4(c)), PITEs again show superior performance, especially PITE ($\rho = 1.00$), compared to MLE and MPSE, while MOM consistently records the highest RMSE values, indicating the least accuracy. Overall, based on the Def criterion (Figure 4(d)), PITEs emerge as the most effective estimators, with MOM exhibiting the poorest performance across all metrics.

Discussion

The discussion section of the paper presents a comprehensive analysis of the three-parameter Weibull distribution, focusing on robust parameter estimation using a novel method termed Probability Integral Transform Estimator (PITE). The three parameters—shape ($\theta$), scale ($\beta$), and location ($\gamma$)—play critical roles in defining the distribution’s characteristics, including its aging behavior and flexibility in modeling real-world scenarios. The paper highlights how varying $\theta$ affects the distribution’s profile, with implications for reliability metrics such as mean time to failure (MTTF), survival function, and failure rate function. The introduction of the $\gamma$ parameter allows for a time delay in aging onset, enhancing model applicability.

The PITE method is introduced as a robust estimator that minimizes the influence of outliers by transforming the data into a standard uniform distribution. The section discusses the estimator’s asymptotic relative efficiency (ARE) compared to the maximum likelihood estimator (MLE), revealing that PITE generally outperforms MLE, particularly in datasets with outliers. Monte Carlo simulations demonstrate the consistency and sensitivity of PITE, showing that it converges to true parameter values even in the presence of outliers. The findings suggest that while PITE excels in outlier-prone datasets, traditional methods like MLE may be more effective for cleaner datasets. The paper concludes by emphasizing the robustness and practical advantages of PITE, while also indicating the need for careful tuning of the parameter $\rho$ to optimize performance based on dataset characteristics. Future research will aim to extend PITE’s applicability to broader statistical models and enhance its handling of censored data.