إعادة النظر في مخاطر نسب المخاطر من خلال المحاكاة ودراسات الحالة
Revisiting the hazards of hazard ratios through simulations and case studies

المجلة: European Journal of Epidemiology، المجلد: 40، العدد: 6
DOI: https://doi.org/10.1007/s10654-025-01245-6
PMID: https://pubmed.ncbi.nlm.nih.gov/40608267
تاريخ النشر: 2025-06-01
المؤلف: Michał Abrahamowicz وآخرون
الموضوع الرئيسي: تقنيات الاستدلال السببي المتقدمة

نظرة عامة

لقد كان مفهوم الخطر محورياً في تحليل بيانات الوقت حتى الحدث لأكثر من خمسة عقود، ويُعرف بأنه احتمال حدوث حدث في وحدة الزمن التالية بين أولئك الذين لا يزالون في خطر. تُستخدم نسب الخطر (HRs) بشكل شائع لتقييم العلاقة بين التعرض أو العلاج ووقت الفشل. ومع ذلك، انتقد هيرنان تفسير نسب الخطر، مقترحاً أن انخفاضها الزمني قد يشير إلى انحياز اختياري بسبب القابلية غير المقاسة بدلاً من التغيرات الحقيقية في تأثير العلاج. وقد أوضح ذلك من خلال تجربة علاج هرموني حيث تحولت نسب الخطر للأحداث القلبية التاجية من ضارة إلى واقية مع مرور الوقت.

استجابةً لذلك، تستخدم هذه الدراسة المحاكاة ودراسات الحالة الواقعية للتحقيق في ادعاءات هيرنان. تُظهر السلسلة الأولى من المحاكاة أن الانحياز في نسب الخطر المستمدة من نموذج كوكس للخطر النسبي يتأثر بالتأثيرات المشتركة للقابلية، وتوزيعها، ووقوع الأحداث، مع حدوث انحياز كبير نحو الصفر فقط تحت ظروف قابلية قوية. تُعيد محاكاة أخرى تجربة العلاج الهرموني، كاشفة أن الانحياز الملحوظ وعبور المخاطر من غير المحتمل أن ينشأ فقط من القابلية غير المقاسة، مما يشير إلى تفسيرات بيولوجية بديلة مثل انخفاض الالتزام بالعلاج. بالإضافة إلى ذلك، توضح أمثلة من أبحاث السرطان نسب الخطر المعتمدة على الزمن القابلة للتفسير. بشكل عام، تشير النتائج إلى أن المخاوف بشأن قيود نسب الخطر قد تكون مبالغ فيها، داعيةً إلى نمذجة نسب الخطر المعتمدة على الزمن مع مراعاة العوامل البيولوجية والسريرية.

مقدمة

في مقدمة هذه الورقة البحثية، يتناول المؤلفون التعقيدات المتعلقة بتفسير نسب الخطر (HRs) في دراسات الصحة البشرية، خاصةً في ضوء الانحيازات المحتملة التي قد تُدخلها عوامل الخطر غير المرصودة، والتي تُسمى “القابلية” أو “الضعف”. يشيرون إلى تعليق هيرنان المؤثر، “مخاطر نسب الخطر”، الذي يبرز كيف يمكن أن تؤدي هذه الانحيازات إلى تقديرات منهجية منخفضة لنسب الخطر، خاصة عند استخدام نموذج كوكس للخطر النسبي (PH). تشير حجج هيرنان إلى أن هذه الانحيازات قد تؤدي إلى استنتاجات مضللة، مثل الإيحاء الخاطئ بتأثير واقي مع مرور الوقت، حتى عندما يكون التعرض ضاراً حقاً.

يعبر المؤلفون عن قلقهم من أن الأدلة التجريبية المقدمة من هيرنان، المستندة إلى تجربة عشوائية محكومة واحدة (RCT) للعلاج الهرموني، قد لا تدعم بالكامل الادعاءات المتعلقة بالانحياز الاختياري المدمج. يلاحظون أنه بينما تعترف الأدبيات الإحصائية بوجود انحيازات في تقدير نسب الخطر، فإن الظروف المحددة التي تظهر فيها هذه الانحيازات، خاصةً فيما يتعلق بـ “عبور المخاطر”، لا تزال أقل وضوحاً. لمعالجة هذه القضايا، يحدد المؤلفون أهداف دراستهم، والتي تشمل إجراء محاكاة لاستكشاف تأثير القابلية غير المقاسة على تقديرات نسب الخطر وتقييم احتمالية التأثيرات المعتمدة على الزمن في التحليلات الواقعية. في النهاية، يهدفون إلى إثبات أن التغيرات الملحوظة في نسب الخطر مع مرور الوقت قد تعكس عمليات سريرية أو بيولوجية حقيقية بدلاً من أن تكون مرتبطة فقط بالانحيازات المتعلقة بالقابلية.

طرق البحث

في هذا القسم، يحدد المؤلفون طرق المحاكاة المستخدمة للتحقيق في تأثير القابلية غير المرصودة على تأثيرات العلاج في تجربة عشوائية افتراضية. باستخدام إطار عمل ADEMP (الأهداف، توليد البيانات، التقديرات، الطرق، مقاييس الأداء)، كانت المحاكاة تهدف إلى تقييم كيفية تأثير عوامل الخطر غير المقاسة على تقديرات نسب الخطر (HRs) المستمدة من نموذج كوكس للخطر النسبي (PH). تركز الدراسة بشكل خاص على العلاقة بين علاج ثنائي غير متغير في الزمن \( A \) وخطر الأحداث السلبية، مع استكشاف تباين هذا التأثير بناءً على افتراضات ومعلمات تصميم مختلفة.

تشير المحاكاة المستهدفة إلى أن الانخفاض الملحوظ في آثار مرض القلب التاجي (CHD) السلبية المرتبطة بالعلاج الهرموني مع مرور الوقت قد يُعزى إلى الخصائص الجوهرية للعلاج بدلاً من أن يكون ناتجاً فقط عن القابلية غير المقاسة. لدعم هذه الفرضية، يقدم المؤلفون أمثلة من العالم الحقيقي لنسب الخطر المعتمدة على الزمن من دراسات السرطان. تم تصميم المحاكاة لتكرار الخصائص الرئيسية للدراسات الواقعية، بما في ذلك تكرار التعرض \( A \)، مدة المتابعة، ومعدلات الحدوث التراكمية. تم اختبار ثلاثة سيناريوهات: السيناريو الأول فحص الخطر المعتمد فقط على التعرض، بينما أدرج السيناريو الثاني والثالث عاملاً قوياً ثنائياً للقابلية \( S \) مع نسبة خطر حقيقية تبلغ 10. تم توليد أوقات الأحداث من توزيع أسي، وتم استخدام امتداد مرن قائم على الانحدار لنموذج كوكس لتقدير log(HR) المعتمد على الزمن دون تعديل للقابلية \( S \). تم تحليل النتائج لمقارنة المنحنيات المقدرة ضد التأثيرات الحقيقية وتقييم معدلات رفض فرضية المخاطر النسبية.

النتائج

تستعرض نتائج المحاكاة المقدمة في هذا القسم تأثيرات القابلية غير المرصودة على تقديرات نسب الخطر (HR) في تحليل البقاء، مع التركيز على كل من نماذج القابلية الثنائية والمستمرة. بالنسبة للقابلية الثنائية، كشفت المحاكاة أن الانحياز في تقديرات log(HR) الخاصة بالسنة كان متغيراً بشكل كبير، مما يشير إلى انتهاكات لفرضية المخاطر النسبية (PH). وُجد أن تقديرات نموذج كوكس العامة، التي تفترض PH، كانت متوسطات لتقديرات السنة المحددة، مع زيادة الانحيازات مع قوة القابلية. من الجدير بالذكر أن الانحيازات كانت ضئيلة (أقل من 20%) عندما كانت نسبة الخطر للقابلية (HR(S)) أقل من 5، ولكن يمكن أن تتجاوز 100% في السيناريوهات القصوى (HR(S) ≥ 15)، مما يشير إلى أن القابلية القوية قد تؤدي إلى استنتاجات مضللة حول تأثيرات التعرض مع مرور الوقت.

في نموذج القابلية المستمرة، ظهرت أنماط مشابهة، مع زيادة الانحيازات نحو الصفر مع تأثيرات القابلية الأقوى. بالنسبة لقيم HR(S) المتوسطة (1.2 إلى 1.5)، كانت الانحيازات ضئيلة، بينما بالنسبة للتأثيرات الأقوى (HR(S) = 3.0)، كانت الانحيازات لا تزال محتواة، ولم تتجاوز 10% للتقديرات العامة عندما كانت معدلات حدوث الأحداث منخفضة. تؤكد النتائج أنه حتى عامل قابلية قوي ولكنه نادر من غير المحتمل أن يؤدي إلى انحيازات كبيرة في تقديرات نسب الخطر، خاصة في الدراسات ذات معدلات التوقف العالية. علاوة على ذلك، أشارت المحاكاة المستهدفة التي تقارن النتائج بتجربة عشوائية محكومة في العالم الحقيقي إلى أن نسب الخطر المبلغ عنها من التجربة من غير المحتمل أن تعكس فقط تأثير القابلية غير المقاسة، مما يشير إلى الحاجة للنظر في تفسيرات بديلة للنتائج الملحوظة.

المناقشة

في هذا القسم، يناقش المؤلفون المنهجية والنتائج من المحاكاة المصممة لتقييم تأثير القابلية غير المرصودة على تقديرات تأثير العلاج في التجارب السريرية، مع التركيز بشكل خاص على العلاج الهرموني. قاموا بتوليد بيانات لأحجام عينات قدرها $N = 4,000$ و $N = 16,000$، محاكاة مؤشرات العلاج الثنائية وخصائص المشاركين مثل العمر والجنس. تم تقدير نسب الخطر (HRs) للعلاج باستخدام نموذج كوكس للخطر النسبي (PH) متعدد المتغيرات، مع تعديل العمر والجنس ولكن ليس للقابلية. كشفت المحاكاة أن القابلية غير المقاسة يمكن أن تؤدي إلى تقديرات متحيزة لتأثير العلاج، خاصةً حيث يميل المشاركون القابلون للخطر إلى تجربة الأحداث في وقت مبكر، مما يؤدي إلى تشويه نسب الخطر مع مرور الوقت. أشار المؤلفون إلى أن الانحيازات في تقديرات نسب الخطر الخاصة بالسنة تأثرت بانتشار القابلية ومعدل حدوث الأحداث التراكمية، مع آثار كبيرة على تفسير تأثيرات العلاج في الدراسات الطولية.

أشارت النتائج إلى أنه مع زيادة وقت المتابعة، انخفضت نسبة المشاركين القابلين للخطر في المجموعة المعالجة، مما أدى إلى تراجع تأثيرات العلاج المقدرة. أثار هذا الظاهرة مخاوف بشأن انتهاك فرضية المخاطر النسبية، حيث كانت الانحيازات صغيرة بشكل عام ما لم تكن القابلية مرتبطة بقوة بالنتيجة. استكشف المؤلفون أيضًا تفسيرات بديلة للتراجع الملحوظ في تقديرات تأثير العلاج، مثل زيادة عدم الالتزام بالعلاج، الذي بدا أنه له تأثير أكبر من القابلية غير المقاسة وحدها. بشكل عام، أكدت المحاكاة على أهمية أخذ العوامل المربكة غير المرصودة في الاعتبار والحاجة إلى تفسير دقيق لتأثيرات العلاج المعتمدة على الزمن في الأبحاث السريرية.

Journal: European Journal of Epidemiology, Volume: 40, Issue: 6
DOI: https://doi.org/10.1007/s10654-025-01245-6
PMID: https://pubmed.ncbi.nlm.nih.gov/40608267
Publication Date: 2025-06-01
Author(s): Michał Abrahamowicz et al.
Primary Topic: Advanced Causal Inference Techniques

Overview

The concept of hazard has been pivotal in the analysis of time-to-event data for over five decades, defined as the probability of an event occurring in the next time unit among those still at risk. Hazard ratios (HRs) are commonly employed to assess the relationship between exposure or treatment and failure time. However, Hernán has criticized the interpretation of HRs, suggesting that their temporal decreases may indicate selection bias due to unmeasured susceptibility rather than true changes in treatment effect. He illustrated this with a hormone therapy trial where HRs for coronary heart events shifted from harmful to protective over time.

In response, this study employs simulations and real-world case studies to investigate Hernán’s claims. The first series of simulations demonstrates that the bias in HRs derived from the Cox proportional hazards model is influenced by the joint effects of susceptibility, its distribution, and event incidence, with significant bias toward the null occurring only under strong susceptibility conditions. Further simulations replicate the hormone therapy trial, revealing that the observed bias and crossing hazards are unlikely to stem solely from unmeasured susceptibility, suggesting alternative biological explanations such as declining treatment adherence. Additionally, real-world examples from cancer research illustrate interpretable time-dependent HRs. Overall, the findings indicate that concerns regarding the limitations of HRs may be exaggerated, advocating for the modeling of time-dependent HRs while considering biological and clinical factors.

Introduction

In the introduction of this research paper, the authors address the complexities involved in interpreting hazard ratios (HRs) in human health studies, particularly in light of potential biases introduced by unobserved risk factors, termed “susceptibility” or “frailty.” They reference Hernán’s influential commentary, “Hazards of hazard ratios,” which highlights how such biases can lead to systematic underestimations of HRs, especially when using the Cox proportional hazards (PH) model. Hernán’s arguments suggest that these biases may result in misleading conclusions, such as the erroneous implication of a protective effect over time, even when an exposure is genuinely harmful.

The authors express concern that the empirical evidence provided by Hernán, based on a single randomized controlled trial (RCT) of hormone therapy, may not fully substantiate the claims regarding built-in selection bias. They note that while the statistical literature acknowledges the existence of biases in HR estimation, the specific conditions under which these biases manifest, particularly regarding “crossing hazards,” remain less clear. To address these issues, the authors outline their study’s objectives, which include conducting simulations to explore the impact of unmeasured susceptibility on HR estimates and assessing the plausibility of time-dependent effects in real-world analyses. Ultimately, they aim to demonstrate that observed changes in HRs over time may reflect genuine clinical or biological processes rather than solely biases related to susceptibility.

Methods

In this section, the authors outline the simulation methods employed to investigate the impact of unobserved susceptibility on treatment effects in a hypothetical randomized trial. Utilizing the ADEMP framework (Aims, Data generation, Estimands, Methods, Performance measures), the simulations aimed to evaluate how unmeasured risk factors influence the estimates of hazard ratios (HRs) derived from the Cox proportional hazards (PH) model. Specifically, the study focuses on the relationship between a time-invariant binary treatment \( A \) and the hazard of adverse events, while exploring the variability of this impact based on different assumptions and design parameters.

The targeted simulations suggest that the observed decrease in adverse coronary heart disease (CHD) effects associated with hormone therapy over time may be attributed to inherent properties of the treatment rather than solely to unmeasured susceptibility. To substantiate this hypothesis, the authors provide real-world examples of time-dependent HRs from cancer studies. The simulations were designed to replicate key characteristics of real-world studies, including the frequency of exposure \( A \), follow-up duration, and cumulative incidence rates. Three scenarios were tested: the first scenario examined the hazard dependent solely on exposure, while the second and third scenarios incorporated a strong binary susceptibility factor \( S \) with a true HR of 10. The event times were generated from an exponential distribution, and a flexible spline-based extension of the Cox model was employed to estimate time-dependent log(HR) without adjusting for susceptibility \( S \). The results were analyzed to compare the estimated curves against the true effects and assess the rejection rates of the proportional hazards hypothesis.

Results

The simulation results presented in this section investigate the effects of unobserved susceptibility on hazard ratio (HR) estimates in survival analysis, focusing on both binary and continuous susceptibility models. For binary susceptibility, simulations revealed that bias in year-specific log(HR) estimates varied significantly, indicating violations of the proportional hazards (PH) assumption. The overall Cox model estimates, which assume PH, were found to be averages of year-specific estimates, with biases increasing with the strength of susceptibility. Notably, biases were minimal (under 20%) when the HR for susceptibility (HR(S)) was less than 5, but could exceed 100% in extreme scenarios (HR(S) ≥ 15), suggesting that strong susceptibility could lead to misleading conclusions about exposure effects over time.

In the continuous susceptibility model, similar patterns emerged, with biases toward the null increasing with stronger susceptibility impacts. For moderate HR(S) values (1.2 to 1.5), biases were minimal, while for stronger impacts (HR(S) = 3.0), biases were still contained, not exceeding 10% for overall estimates when event incidence was low. The results underscore that even a strong but rare susceptibility factor is unlikely to induce significant biases in HR estimates, particularly in studies with high censoring rates. Furthermore, targeted simulations comparing the results to a real-world randomized controlled trial indicated that the reported HRs from the trial were unlikely to reflect solely the influence of unmeasured susceptibility, suggesting the need to consider alternative explanations for the observed outcomes.

Discussion

In this section, the authors discuss the methodology and findings from simulations designed to assess the impact of unobserved susceptibility on treatment effect estimates in clinical trials, particularly focusing on hormone therapy. They generated data for sample sizes of $N = 4,000$ and $N = 16,000$, simulating binary treatment indicators and participant characteristics such as age and sex. The hazard ratios (HRs) for treatment were estimated using a multivariable Cox proportional hazards (PH) model, adjusting for age and sex but not for susceptibility. The simulations revealed that unmeasured susceptibility could lead to biased treatment effect estimates, particularly as susceptible participants tended to experience events earlier, thereby skewing the HRs over time. The authors noted that biases in year-specific HR estimates were influenced by the prevalence of susceptibility and the cumulative incidence of events, with significant implications for the interpretation of treatment effects in longitudinal studies.

The results indicated that as follow-up time increased, the proportion of high-risk susceptible participants in the treated group diminished, leading to an attenuation of estimated treatment effects. This phenomenon raised concerns about the violation of the proportional hazards assumption, as biases were generally small unless susceptibility was strongly associated with the outcome. The authors also explored alternative explanations for the observed decay in treatment effect estimates, such as increasing treatment non-adherence, which appeared to have a more substantial impact than unmeasured susceptibility alone. Overall, the simulations underscored the importance of accounting for unobserved confounders and the need for careful interpretation of time-dependent treatment effects in clinical research.