DOI: https://doi.org/10.1186/s12874-025-02510-8
PMID: https://pubmed.ncbi.nlm.nih.gov/40025441
تاريخ النشر: 2025-03-01
المؤلف: Doranne Thomassen وآخرون
الموضوع الرئيسي: طرق إحصائية واستدلال
نظرة عامة
تتناول الدراسة التحديات المرتبطة بفقدان النتائج المبلغ عنها من قبل المرضى (PROs) في التقييمات الطبية، وخاصة بسبب ارتباطها بحالة المرض لدى المرضى. تؤكد على أهمية دمج المعلومات حول الأحداث المتزامنة (ICEs)، مثل تقدم المرض والوفاة، في نماذج الاستيفاء لقياسات PRO المتكررة. يقترح المؤلفون إطار عمل حيث يُفترض أن بيانات PRO المفقودة مفقودة عشوائيًا، مشروطة بالقياسات الملاحظة وتوقيت ICEs، إلى جانب متغيرات أخرى. تم تطبيق هذا الإطار على بيانات PRO مجهولة الهوية من تجربة سريرية تشمل مرضى يعانون من سرطان الرئة المتقدم.
تشير النتائج إلى أن دمج ICEs في عملية الاستيفاء يؤدي إلى تقدير أكثر دقة لجودة الحياة المتعلقة بالصحة، حيث تظهر قيم متوسطة أقل مقارنة بالطرق التقليدية مثل تحليل الحالة المتاحة واستيفاء نموذج مختلط خطي ساذج. يستنتج المؤلفون أن فصل نموذج البيانات المفقودة عن نموذج التحليل أمر حاسم، حيث قد تحدث ICEs بعد القياسات المفقودة. يدعون إلى استخدام طرق الاستيفاء المتعددة (MI) ووزن الاحتمالية العكسية (IPW) بدلاً من الأساليب المباشرة المعتمدة على الاحتمالية، اعتمادًا على ثقة الباحث في نمذجة إما النتائج المفقودة أو احتمال الفقدان. تسلط الدراسة الضوء على ضرورة إجراء مزيد من الأبحاث لمقارنة طرق الاستيفاء المختلفة التي تدمج معلومات ICE، مما يعزز أهمية مراعاة توقيت ووقوع ICE في التعامل مع بيانات PRO المفقودة.
مقدمة
في مقدمة هذه الورقة البحثية، يبرز المؤلفون الأهمية المتزايدة للنتائج المبلغ عنها من قبل المرضى (PROs) في التجارب السريرية، خاصة في علم الأورام، كمؤشرات على فعالية العلاج وقابليته للتحمل. على الرغم من أهميتها، يشير المؤلفون إلى نقص في الأساليب المنظمة لتحليل بيانات PRO في العديد من الدراسات المتعلقة بعلم الأورام. يشيرون إلى إطار عمل ICH E9 (R1)، الذي يوفر طريقة لترجمة أسئلة البحث المتعلقة بـ PRO إلى تقديرات محددة جيدًا، لكنهم يشيرون إلى أن توافق استراتيجيات بيانات PRO المفقودة مع هذه التقديرات لم يحظ بالاهتمام الكافي.
يؤكد المؤلفون على ضرورة تعريف التقديرات من خلال تحديد العلاج، والسكان، والمتغيرات ذات الصلة، واستراتيجيات التعامل مع الأحداث المتزامنة (ICEs)، التي يمكن أن تؤثر على تفسير قياسات PRO. ينتقدون الأساليب التقليدية للتعامل مع البيانات الطولية المفقودة، مثل النماذج المختلطة، التي قد لا تتماشى مع استراتيجيات ICE المختارة. تهدف الورقة إلى تقييم طرق الاستيفاء لبيانات PRO المفقودة التي تأخذ في الاعتبار توقيت ووقوع ICEs، وتكون مناسبة للقياسات المتكررة، وتتوافق مع التقدير المختار، ولا تستوفي PROs بعد الوفاة. يتم توضيح الأساليب باستخدام بيانات مجهولة الهوية من تجربة سريرية تشمل مرضى يعانون من سرطان الرئة المتقدم.
الطرق
في هذا القسم، يوضح تومسن وآخرون (2025) طرق معالجة بيانات النتائج المبلغ عنها من قبل المرضى (PRO) المفقودة، مقارنة تقنيات الاستيفاء مع نهج وزن الاحتمالية العكسية (IPW-GEE). استخدم المؤلفون معادلة تقدير عامة (GEE) لتقدير متوسط جودة الحياة (QoL) أثناء الحياة، باستخدام بيانات غير مكتملة موزونة حسب الاحتمالية العكسية لتوافر القياسات. تم اشتقاق الأوزان من نموذج انحدار لوجستي مرن يتضمن نفس المتغيرات المستقلة مثل نماذج الاستيفاء، تلاه التثبيت والتقطيع. بالإضافة إلى ذلك، قاموا بتقييم تأثير استبعاد المعلومات حول المتغيرات التوضيحية (ICEs) في عملية الاستيفاء من خلال ملاءمة نموذج مختلط خطي ساذج يتضمن فقط المتغيرات الأساسية.
يؤكد المؤلفون أنه بينما تم عرض طرقهم باستخدام بيانات من تجربة ذات ذراع واحدة، فإن النتائج المتعلقة بفائدة معلومات ICE في استيفاء بيانات PRO المفقودة تنطبق أيضًا على الدراسات العشوائية. يؤكدون أن تقنيات الاستيفاء يمكن تكييفها لمختلف نماذج التحليل الموضوعية لاشتقاق تقديرات مختلفة ذات صلة، مثل تلك المتعلقة بالوفاة أو انقطاع العلاج. ركزت الدراسة بشكل أساسي على استيفاء PROs على مقياسها العددي الأصلي، مما يسمح بإجراء تحليلات لاحقة، بما في ذلك تقدير المتوسط والتغيير من الأساس. إذا كانت ثنائية قيم PRO ضرورية، يوصي المؤلفون أولاً باستيفاء القيم على المقياس العددي قبل تطبيق الثنائية في كل مجموعة بيانات مستوفاة لتقليل التحيز والحفاظ على القوة الإحصائية.
النتائج
أدى تحليل نماذج الاستيفاء (1-5) المقدمة في القسم 3.3.2 إلى تقديرات قابلة للمقارنة لمتوسط جودة الحياة (QoL) بمرور الوقت، كما هو موضح في الشكل 2. من الجدير بالذكر أن نموذج المطابقة التنبؤية ذو المستويين (النموذج 2) أنتج تقديرات أعلى قليلاً من النماذج الأخرى. كان نهج إعادة الوزن (النموذج 6) متوافقًا بشكل وثيق مع نتائج الاستيفاء خلال الدورات الـ 20 الأولى؛ ومع ذلك، أظهر عدم استقرار في الدورات اللاحقة بسبب ندرة بعض أنواع المرضى، مما أدى إلى أوزان غير متناسبة بين المرضى. كانت هذه الفجوة واضحة بشكل خاص للمرضى الذين عانوا من الوفاة المبكرة أو تقدم المرض (PD)، مما أدى إلى تقديرات متوسطة لجودة الحياة تختلف عن تلك المشتقة من طرق الاستيفاء.
من المهم أن جميع طرق الاستيفاء التي دمجت أحداث التوقف المعلوماتية (ICEs) (النماذج 1-5) أدت إلى تقديرات متوسطة لجودة الحياة أقل مقارنة بالبيانات المتاحة (النموذج 0) والاستيفاء الذي استبعد معلومات ICE (النموذج 7). بينما كانت تقديرات متوسط جودة الحياة من النماذج 1-5 مشابهة لتلك من البيانات المتاحة في الدورات المبكرة، اتسعت الفجوة لتصل إلى حوالي 5 نقاط في الدورات اللاحقة، تزامنًا مع زيادة في القيم المفقودة ووقوع ICE. من حيث الكفاءة الإحصائية، كانت الأخطاء المعيارية عبر معظم طرق الاستيفاء قابلة للمقارنة، مما لا يقدم تفضيلًا محددًا لأي طريقة واحدة. ومع ذلك، أظهر النموذج 2 فترات ثقة (CIs) أوسع من الآخرين، وأنتجت طريقة المعادلات التقديرية العامة الموزونة بالاحتمالية العكسية (IPW-GEE) (النموذج 6) فترات ثقة كانت متسقة مع طرق الاستيفاء في الدورات السابقة ولكنها أظهرت عدم يقين كبير في الدورات اللاحقة، مما يعكس عدم استقرار التقديرات النقطية المقابلة.
المناقشة
في هذه الدراسة، استكشفنا استيفاء النتائج المبلغ عنها من قبل المرضى (PROs) الطولية مع الأخذ في الاعتبار الأحداث المتزامنة (ICEs) مثل الوفاة وانقطاع العلاج. أثبتنا أن دمج معلومات ICE في نماذج الاستيفاء أدى إلى تقديرات أكثر دقة لجودة الحياة المتعلقة بالصحة (HRQoL) بمرور الوقت، على عكس الطرق التقليدية التي تجاهلت هذه العوامل. على وجه الخصوص، أظهرت تحليلاتنا أن تقديرات متوسط HRQoL كانت أقل عندما تم أخذ ICEs في الاعتبار، مما يعكس الواقع أن المرضى في حالة صحية أسوأ أقل احتمالًا للإبلاغ عن النتائج. يتماشى هذا مع النتائج من هاوغ وآخرين، التي أكدت على أهمية دمج ICEs في استراتيجيات البيانات المفقودة لتعزيز صحة التقديرات.
أظهرت تنفيذ طرق استيفاء متنوعة، بما في ذلك وزن الاحتمالية العكسية (IPW) والاستيفاء المتعدد (MI)، أنه بينما كانت التقديرات مشابهة عبر الطرق، كانت الكفاءة الحسابية متفاوتة. أظهرت طريقة IPW عدم استقرار في الدورات اللاحقة، مما يبرز التحديات المتعلقة بالبيانات المفقودة في الدراسات الطولية. بشكل عام، تؤكد نتائجنا على ضرورة معالجة ICEs في تحليل بيانات PRO لضمان أن التقديرات تعكس بدقة تجارب السكان المرضى، خاصة في التجارب السريرية التي تشمل حالات صحية خطيرة مثل السرطان.
القيود
تسلط القيود المتعلقة ببيانات التجربة المقدمة في هذه الدراسة الضوء على تحديات كبيرة تتعلق بندرة البيانات، خاصة بعد وقت انقطاع العلاج (TD). يتطلب نقص المعلومات في بعض المناطق الاعتماد على افتراضات نموذجية قوية، مثل تحديد الوقت حتى TD بالصفر بعد TD، مما يمكن أن يؤدي إلى عدم استقرار في نهج المعادلات التقديرية العامة الموزونة بالاحتمالية العكسية (IPW-GEE) خلال الدورات اللاحقة. وبالتالي، يصبح تقدير تقدير سياسة العلاج أثناء الحياة معتمدًا بشكل كبير على افتراضات لا يمكن اختبارها، خاصة عندما يتوقف جمع البيانات بعد TD.
علاوة على ذلك، يثير افتراض الفقدان العشوائي (MAR) مخاوف، حيث قد لا تكون العلاقة بين النقاط السريرية الوسيطة (ICEs) والنتائج المبلغ عنها من قبل المرضى (PROs) في البيانات الملاحظة صحيحة في غياب البيانات. لمعالجة هذه القيود، يوصي المؤلفون بإجراء تحليلات حساسية لتقييم تأثيرات افتراضات نموذج الاستيفاء على التقديرات المشتقة من التجربة. بالإضافة إلى ذلك، بالنسبة للدراسات المخصصة لمراجعة الدافعين أو الجهات التنظيمية، يُنصح بشدة بالتواصل مع أصحاب المصلحة لتحديد الأساليب المناسبة للتعامل مع البيانات المفقودة التي تتماشى مع التقديرات ذات الصلة.
DOI: https://doi.org/10.1186/s12874-025-02510-8
PMID: https://pubmed.ncbi.nlm.nih.gov/40025441
Publication Date: 2025-03-01
Author(s): Doranne Thomassen et al.
Primary Topic: Statistical Methods and Inference
Overview
The study addresses the challenges associated with missing patient-reported outcomes (PROs) in medical evaluations, particularly due to their correlation with patients’ disease status. It emphasizes the importance of incorporating information about intercurrent events (ICEs), such as disease progression and death, into imputation models for repeated PRO measurements. The authors propose a framework where missing PRO data is assumed to be missing at random, contingent on observed measurements and the timing of ICEs, alongside other covariates. This framework was applied to anonymized PRO data from a clinical trial involving patients with advanced lung cancer.
The results indicate that incorporating ICEs into the imputation process yields a more accurate estimation of health-related quality of life, showing lower mean values compared to traditional methods like available case analysis and naive linear mixed model imputation. The authors conclude that separating the missing data model from the analysis model is crucial, as ICEs may occur after the missed measurements. They advocate for the use of multiple imputation (MI) and inverse probability weighting (IPW) methods over direct likelihood-based approaches, depending on the researcher’s confidence in modeling either the missing outcomes or the probability of missingness. The study highlights the necessity for further research to compare various imputation methods that integrate ICE information, reinforcing the importance of considering ICE timing and occurrence in handling missing PRO data.
Introduction
In the introduction of this research paper, the authors highlight the growing importance of patient-reported outcomes (PROs) in clinical trials, particularly in oncology, as indicators of treatment efficacy and tolerability. Despite their significance, the authors note a lack of structured approaches for analyzing PRO data in many oncology studies. They reference the ICH E9 (R1) framework, which provides a method for translating PRO-related research questions into well-defined estimands, but point out that the alignment of missing PRO data strategies with these estimands has received insufficient attention.
The authors emphasize the necessity of defining estimands by specifying treatment, population, variables of interest, and strategies for handling intercurrent events (ICEs), which can affect the interpretation of PRO measurements. They critique traditional methods for handling missing longitudinal data, such as mixed models, which may not align with the chosen ICE strategies. The paper aims to evaluate imputation methods for missing PRO data that consider the timing and occurrence of ICEs, are suitable for repeated measures, align with the chosen estimand, and do not impute PROs post-mortem. The methods are illustrated using anonymized data from a clinical trial involving patients with advanced lung cancer.
Methods
In this section, Thomassen et al. (2025) outline methods for addressing missing patient-reported outcome (PRO) data, comparing imputation techniques with an inverse probability weighting approach (IPW-GEE). The authors employed a generalized estimating equation (GEE) to estimate the mean quality of life (QoL) while alive, utilizing incomplete data weighted by the inverse probability of measurement availability. The weights were derived from a flexible logistic regression model incorporating the same independent variables as the imputation models, followed by stabilization and truncation. Additionally, they assessed the impact of excluding information about informative covariates (ICEs) in the imputation process by fitting a naive linear mixed model that only included baseline covariates.
The authors assert that while their methods were demonstrated using data from a single-arm trial, the findings regarding the utility of ICE information in imputing missing PRO data are applicable to randomized studies as well. They emphasize that the imputation techniques can be adapted for various substantive analysis models to derive different estimands of interest, such as those related to death or treatment discontinuation. The study primarily focused on imputing PROs on their original numerical scale, allowing for subsequent analyses, including mean estimation and change from baseline. If dichotomization of PRO values is necessary, the authors recommend first imputing the values on the numerical scale before applying dichotomization in each imputed dataset to mitigate bias and preserve statistical power.
Results
The analysis of the imputation models (1-5) presented in Section 3.3.2 yielded comparable estimates of mean quality of life (QoL) over time, as illustrated in Figure 2. Notably, the two-level predictive mean matching model (model 2) produced slightly higher estimates than the other models. The reweighting approach (model 6) aligned closely with the imputation results during the initial 20 cycles; however, it exhibited instability in later cycles due to the rarity of certain patient types, leading to disproportionate weights among patients. This discrepancy was particularly evident for patients who experienced early mortality or progression of disease (PD), resulting in mean QoL estimates that diverged from those derived from the imputation methods.
Crucially, all imputation methods that incorporated informative censoring events (ICEs) (models 1-5) resulted in lower estimated mean QoL compared to the available data (model 0) and the imputation that excluded ICE information (model 7). While the mean QoL estimates from models 1-5 were similar to those from the available data in early cycles, the gap widened to approximately 5 points in later cycles, coinciding with an increase in missing values and ICE occurrences. In terms of statistical efficiency, the standard errors across most imputation methods were comparable, offering no definitive preference for any single method. However, model 2 exhibited wider confidence intervals (CIs) than the others, and the inverse probability weighting generalized estimating equations (IPW-GEE) method (model 6) produced CIs that were consistent with the imputation methods in earlier cycles but displayed significant uncertainty in later cycles, reflecting the instability of the corresponding point estimates.
Discussion
In this study, we explored the imputation of longitudinal patient-reported outcomes (PROs) while accounting for intercurrent events (ICEs) such as death and treatment discontinuation. We established that incorporating ICE information into the imputation models led to more accurate estimates of health-related quality of life (HRQoL) over time, as opposed to traditional methods that ignored these factors. Specifically, our analysis demonstrated that the mean HRQoL estimates were lower when ICEs were considered, reflecting the reality that patients in poorer health are less likely to report outcomes. This aligns with findings from Haug et al., which emphasized the significance of integrating ICEs into missing data strategies to enhance the validity of estimands.
The implementation of various imputation methods, including inverse probability weighting (IPW) and multiple imputation (MI), revealed that while estimates were similar across methods, computational efficiency varied. The IPW method exhibited instability in later cycles, highlighting the challenges of missing data in longitudinal studies. Overall, our findings underscore the necessity of addressing ICEs in the analysis of PRO data to ensure that estimands accurately reflect the patient population’s experiences, particularly in clinical trials involving serious health conditions like cancer.
Limitations
The limitations of the trial data presented in this study highlight significant challenges related to data sparsity, particularly after the time of treatment discontinuation (TD). The lack of information in certain regions necessitates reliance on strong model assumptions, such as setting the time-till-TD to zero post-TD, which can lead to instability in the Inverse Probability Weighted Generalized Estimating Equations (IPW-GEE) approach during later cycles. Consequently, the estimation of a while-alive treatment policy estimand becomes heavily dependent on untestable assumptions, particularly when data collection ceases after TD.
Moreover, the assumption of Missing At Random (MAR) raises concerns, as the relationship between the Intermediate Clinical Endpoints (ICEs) and Patient-Reported Outcomes (PROs) in the observed data may not hold true in the absence of data. To address these limitations, the authors recommend conducting sensitivity analyses to evaluate the effects of imputation model assumptions on the estimates derived from the trial. Additionally, for studies intended for payer or regulatory review, engaging with stakeholders to establish appropriate methods for handling missing data that align with the estimands of interest is strongly advised.
