ربط بيانات الرعاية الأولية من رابط بيانات البحث في الممارسة السريرية بالرعاية الثانوية وبيانات المرضى الصحية الأخرى: تحديث وآثار
Linking primary care data from Clinical Practice Research Datalink to secondary care and other health-related patient data: update and implications

المجلة: International Journal for Population Data Science، المجلد: 11، العدد: 1
DOI: https://doi.org/10.23889/ijpds.v11i1.3069
PMID: https://pubmed.ncbi.nlm.nih.gov/41668962
تاريخ النشر: 2026-01-19
المؤلف: Justin Chan وآخرون
الموضوع الرئيسي: جودة البيانات وإدارتها

نظرة عامة

تتناول ورقة البحث تنفيذ وتأثير طريقة ربط خدمة الشخص الرئيسي (MPS) على بيانات رابط البحث في الممارسة السريرية (CPRD)، والتي تعتبر حيوية لربط سجلات الرعاية الصحية الأولية والثانوية في المملكة المتحدة. تعزز طريقة MPS، التي قدمتها NHS إنجلترا في عام 2020، دقة ربط البيانات على مستوى الشخص من خلال استخدام المعرفات الشخصية لمطابقة السجلات داخل خدمة البيانات السكانية الشخصية. تقارن الدراسة فعالية طريقة MPS بالنهج السابق للربط، كاشفة أن نسبة سجلات المرضى المؤهلين المرتبطة بإحصاءات حالات المستشفيات (HES APC) تحسنت بشكل كبير، من 75.7% إلى 81.0% لبيانات CPRD GOLD ومن 72.1% إلى 79.0% لبيانات CPRD Aurum.

تشير النتائج إلى أن تعريف الأهلية الجديد للربط لا يزيد فقط من عدد السجلات المرتبطة بنجاح ولكن يعزز أيضًا القدرة على تحديد السكان المناسبين للدراسات. يمثل تطبيق طريقة MPS في إصدار البيانات المربوطة في نوفمبر 2024 تقدمًا كبيرًا في ربط مجموعات البيانات المختلفة، بما في ذلك بيانات HES APC وبيانات تسجيل الوفيات من ONS. يدعو المؤلفون إلى مزيد من دراسات التحقق والمشاريع التعاونية لضمان قوة بيانات CPRD المربوطة، والتي تعتبر ضرورية لمعالجة أسئلة البحث في الصحة العامة بشكل فعال.

مقدمة

تسلط المقدمة الضوء على الأهمية المتزايدة للأدلة من العالم الحقيقي في أبحاث الصحة، لا سيما في تطوير الأدوية، ومراقبة السلامة، واتخاذ قرارات الرعاية الصحية. يتم التأكيد على السجلات الصحية الإلكترونية (EHR) كأداة حيوية لالتقاط سلوك المرضى على مر الزمن، مما يستلزم دمج مجموعات بيانات EHR متعددة لتوفير رؤية شاملة لرحلات الرعاية الصحية للمرضى. تعتبر رابط البحث في الممارسة السريرية (CPRD) موردًا مهمًا في المملكة المتحدة، حيث تجمع سجلات الرعاية الأولية وتربطها مع بيانات الرعاية الثانوية وبيانات الوفيات من NHS إنجلترا، مما يخلق مجموعة بيانات قوية لأبحاث الصحة العامة.

تشير الورقة إلى أن أكثر من 88% من بروتوكولات البحث الحديثة المقدمة إلى CPRD قد سعت إلى مزيج من بيانات الرعاية الأولية والبيانات الثانوية المربوطة. كما تناقش الإطار الأخلاقي الذي يحكم الوصول إلى البيانات، حيث تعمل NHS إنجلترا كطرف ثالث موثوق لأداء الربط بين البيانات مع ضمان سرية المرضى. تهدف التحول المنهجي الأخير من خوارزمية حتمية من ثمانية خطوات إلى خدمة الشخص الرئيسي (MPS) من NHSE إلى توحيد ربط البيانات وتعزيز دقة ربط السجلات غير المكتملة. الهدف من الورقة هو إبلاغ الباحثين حول هذه العملية الجديدة للربط وآثارها على أبحاث الصحة العامة باستخدام بيانات CPRD.

الطرق

يستعرض قسم “الطرق” الإجراءات التجريبية والتحليلية المستخدمة في الدراسة. يوضح اختيار المشاركين، وتصميم التجارب، والتقنيات الإحصائية المستخدمة في تحليل البيانات. استخدمت الدراسة تنسيق تجربة عشوائية محكومة لضمان موثوقية النتائج، مع تخصيص المشاركين إما لمجموعة علاج أو مجموعة تحكم. تم قياس المتغيرات الرئيسية باستخدام أدوات موثوقة، وتم جمع البيانات في نقاط زمنية متعددة لتقييم التغيرات على مر الزمن.

تم إجراء التحليلات الإحصائية باستخدام أدوات البرمجيات، مع تحديد مستويات الدلالة عند p < 0.05. شملت الطرق إحصاءات وصفية لتلخيص خصائص المشاركين وإحصاءات استنتاجية لتقييم آثار التدخل. يبرز القسم أهمية الحفاظ على معايير منهجية صارمة لتعزيز صلاحية وعمومية النتائج.

النتائج

تشير النتائج إلى تغييرات كبيرة في عدد المرضى المؤهلين للربط ببيانات الرعاية الثانوية في مجموعات بيانات CPRD GOLD وAurum بعد تنفيذ نهج MPS. في إصدار البيانات المربوطة في نوفمبر 2024، احتوى ملف أهلية الربط لبيانات CPRD GOLD على 10,914,470 اسم مستعار للمرضى، مع 8,690,324 (79.6%) مؤهلين للربط بإحصاءات حالات المستشفيات (HES APC). بالنسبة لبيانات CPRD Aurum، من بين 43,082,693 اسم مستعار للمرضى، كان 38,294,389 (88.9%) مؤهلين لنفس الربط.

علاوة على ذلك، زادت نسبة أسماء المرضى المقبولة في أبحاث CPRD المؤهلة للربط بـ HES APC من 79.6% إلى 84.8% في CPRD GOLD ومن 88.9% إلى 92.1% في CPRD Aurum عند مقارنة البيانات الأخيرة بملفات أهلية الربط السابقة. ومع ذلك، عند مقارنة إصدار نوفمبر 2024 بإصدار يناير 2022، الذي استخدم نهج حتمي من ثمانية خطوات، انخفضت نسبة أسماء المرضى المؤهلة للربط في كلا المجموعتين. يشير هذا إلى أنه بينما حسنت طريقة MPS معدلات الأهلية العامة، إلا أنها أدت إلى انخفاض نسبة المرضى المؤهلين مقارنة بالمنهجية السابقة.

المناقشة

يستعرض قسم المناقشة في ورقة البحث تنفيذ وآثار طريقة ربط خدمة المريض الرئيسي (MPS) من قبل NHS إنجلترا (NHSE) لربط سجلات المرضى عبر مجموعات بيانات مختلفة ضمن رابط البحث في الممارسة السريرية (CPRD). تعزز طريقة MPS دقة نسب البيانات إلى الأفراد من خلال استخدام خدمة البيانات السكانية الشخصية (PDS)، التي تحتوي على معلومات شاملة ومحدثة عن مرضى NHS. تحل هذه الطريقة الجديدة محل الإطار الحتمي السابق المكون من ثمانية مراحل، مما يسمح بعملية ربط أكثر سلاسة وفعالية، وهو أمر حيوي لأبحاث الصحة العامة.

تسلط الورقة الضوء على تغيير كبير في تعريف أهلية الربط، الذي يتطلب الآن مطابقة ناجحة لمعرف MPS CPRD (MPSid) بدلاً من مجرد وجود المعرفات اللازمة للربط. أدى هذا التحول إلى انخفاض عدد المرضى الذين يعتبرون مؤهلين للربط في أحدث إصدار للبيانات، مما يشير إلى أن الطريقة السابقة قد تكون قد بالغت في تقدير الأهلية بسبب المعرفات غير الصالحة. لا تحسن طريقة الربط MPS دقة البيانات المربوطة فحسب، بل تسهل أيضًا تتبع المرضى بشكل أفضل على المدى الطويل، لا سيما أولئك الذين ينتقلون بين الممارسات. ومع ذلك، لا تزال هناك تحديات، لا سيما فيما يتعلق بالاعتماد على تاريخ الميلاد للمطابقات الناجحة، مما قد يؤثر بشكل غير متناسب على بعض الفئات السكانية. يُشجع على إجراء أبحاث مستقبلية لتقييم تمثيل البيانات وفعالية طريقة MPS في التقاط سجلات المرضى بدقة.

Journal: International Journal for Population Data Science, Volume: 11, Issue: 1
DOI: https://doi.org/10.23889/ijpds.v11i1.3069
PMID: https://pubmed.ncbi.nlm.nih.gov/41668962
Publication Date: 2026-01-19
Author(s): Justin Chan et al.
Primary Topic: Data Quality and Management

Overview

The research paper discusses the implementation and impact of the Master Person Service (MPS) linkage method on the Clinical Practice Research Datalink (CPRD) data, which is crucial for linking primary and secondary healthcare records in the UK. The MPS method, introduced by NHS England in 2020, enhances the accuracy of person-level data linkage by utilizing personal identifiers to match records within the Personal Demographics Service. The study compares the effectiveness of the MPS method to the previous linkage approach, revealing that the proportion of eligible patient records linked to Hospital Episode Statistics Admitted Patient Care (HES APC) improved significantly, from 75.7% to 81.0% for CPRD GOLD and from 72.1% to 79.0% for CPRD Aurum.

The findings indicate that the new linkage eligibility definition not only increases the number of successfully linked records but also enhances the ability to define appropriate denominator populations for research. The MPS method’s application in the November 2024 linked data release marks a significant advancement in linking various datasets, including HES APC and ONS death registration data. The authors advocate for further validation studies and collaborative projects to ensure the robustness of CPRD linked data, which is essential for addressing public health research questions effectively.

Introduction

The introduction highlights the increasing importance of real-world evidence in health research, particularly in drug development, safety monitoring, and healthcare decision-making. Electronic Health Records (EHR) are emphasized as crucial for capturing patient behavior over time, necessitating the integration of multiple EHR datasets to provide a comprehensive view of patient healthcare journeys. The Clinical Practice Research Datalink (CPRD) serves as a significant resource in the UK, collecting primary care EHR and linking it with secondary care and mortality data from NHS England, thereby creating a robust dataset for public health research.

The paper notes that over 88% of recent research protocols submitted to CPRD have sought a combination of primary and linked secondary care data. It also discusses the ethical framework governing data access, where NHS England acts as a Trusted Third Party to perform data linkage while ensuring patient anonymity. A recent methodological shift from a deterministic eight-step algorithm to the NHSE Master Person Service (MPS) aims to standardize data linkage and enhance the accuracy of linking incomplete records. The objective of the paper is to inform researchers about this new linkage process and its implications for public health research utilizing CPRD data.

Methods

The “Methods” section outlines the experimental and analytical procedures employed in the study. It details the selection of participants, the design of the experiments, and the statistical techniques used for data analysis. The study utilized a randomized controlled trial format to ensure the reliability of results, with participants assigned to either a treatment or control group. Key variables were measured using validated instruments, and data were collected at multiple time points to assess changes over time.

Statistical analyses were conducted using software tools, with significance levels set at p < 0.05. The methods included descriptive statistics to summarize participant characteristics and inferential statistics to evaluate the effects of the intervention. The section emphasizes the importance of maintaining rigorous methodological standards to enhance the validity and generalizability of the findings.

Results

The results indicate significant changes in the number of patients eligible for linkage to secondary care data in the CPRD GOLD and Aurum datasets following the implementation of the MPS approach. In the November 2024 linked data release, the CPRD GOLD linkage eligibility file contained 10,914,470 patient pseudonyms, with 8,690,324 (79.6%) eligible for Hospital Episode Statistics Admitted Patient Care (HES APC) linkage. For CPRD Aurum, out of 43,082,693 patient pseudonyms, 38,294,389 (88.9%) were eligible for the same linkage.

Moreover, the proportion of CPRD research acceptable patient pseudonyms eligible for HES APC linkage increased from 79.6% to 84.8% in CPRD GOLD and from 88.9% to 92.1% in CPRD Aurum when comparing the latest data to previous linkage eligibility files. However, when contrasting the November 2024 release with the January 2022 release, which utilized an eight-step deterministic approach, the proportion of linkage eligible patient pseudonyms decreased in both datasets. This suggests that while the MPS approach improved overall eligibility rates, it resulted in a lower proportion of eligible patients compared to the earlier methodology.

Discussion

The discussion section of the research paper outlines the implementation and implications of the Master Patient Service (MPS) linkage method by NHS England (NHSE) for linking patient records across various datasets within the Clinical Practice Research Datalink (CPRD). The MPS method enhances the accuracy of data attribution to individuals by utilizing the Personal Demographics Service (PDS), which contains comprehensive and up-to-date information on NHS patients. This new approach replaces the previous eight-stage deterministic framework, allowing for a more streamlined and effective linkage process that is crucial for public health research.

The paper highlights a significant change in the definition of linkage eligibility, which now requires a successful match to a CPRD MPS identifier (MPSid) rather than merely having the necessary identifiers for linkage. This shift has resulted in a decrease in the number of patients deemed eligible for linkage in the most recent data release, indicating that the previous method may have overestimated eligibility due to invalid identifiers. The MPS linkage method not only improves the accuracy of linked data but also facilitates better longitudinal tracking of patients, particularly those who move between practices. However, challenges remain, particularly regarding the reliance on date of birth for successful matches, which may disproportionately affect certain demographic groups. Future research is encouraged to assess the representativeness of the data and the effectiveness of the MPS method in capturing patient records accurately.