التعلم الآلي يتنبأ بملفات إطلاق الأدوية ومعلمات الحركة بناءً على تركيبات الأقراص
Machine Learning Predicts Drug Release Profiles and Kinetic Parameters Based on Tablets’ Formulations

المجلة: The AAPS Journal، المجلد: 27، العدد: 5
DOI: https://doi.org/10.1208/s12248-025-01101-1
PMID: https://pubmed.ncbi.nlm.nih.gov/40721685
تاريخ النشر: 2025-07-28
المؤلف: Chrystalla Protopapa وآخرون
الموضوع الرئيسي: طرق اكتشاف الأدوية الحاسوبية

نظرة عامة

تدرس الدراسة تطبيق تقنيات التعلم الآلي (ML) لتعزيز عملية تحسين التركيب في تصنيع الأشكال الصلبة عن طريق الضغط المباشر (DC). من خلال إنتاج 377 تركيبة وقياس ملفات إطلاق الدواء الخاصة بها تحت ظروف الذوبان الديناميكية على مدى 480 دقيقة، كان هدف الباحثين هو توقع هذه الملفات باستخدام طرق ML متنوعة. من بين التقنيات الست التي تم استكشافها، أظهرت غابة عشوائية (RF) وتعزيز التدرج المتطرف (XGB) قدرات تنبؤية ملحوظة، حيث حققت قيم $R^2$ لخمس مرات من التحقق المتقاطع تبلغ 0.635 ± 0.047 و0.601 ± 0.091، على التوالي. بالإضافة إلى ذلك، تضمنت نهجًا ثانويًا يتمثل في توقع المعلمات الحركية لنماذج ويبل والنموذج المعدل من الدرجة الأولى، والتي أسفرت عن نتائج قابلة للمقارنة مع توقعات الملف المباشر.

كشفت تحليل البيانات الاستكشافية عن مجموعة بيانات متنوعة تشمل 20 مكونًا نشطًا من الأدوية (APIs) من جميع الفئات الأربعة لنظام تصنيف الأدوية الحيوية (BCS)، مما ساهم في تعقيد مهمة التنبؤ. أدارت تقنيات ML هذه التعقيد بفعالية، حيث حققت RF وXGB أخطاء جذر متوسط المربعات (RMSEs) تبلغ 13.67 ± 0.99% و14.16 ± 0.66%، على التوالي. من الجدير بالذكر أن تضمين بيانات الإطلاق حتى 240 دقيقة حسن بشكل كبير من أداء النموذج. تشير النتائج إلى أن ML يمكن أن تتنبأ ليس فقط بملفات إطلاق الدواء ولكن أيضًا تقدم رؤى حول المعلمات الحركية، مما يعزز عملية النمذجة للباحثين في مجال الأدوية. ستركز الأبحاث المستقبلية على تحسين قابلية تفسير النموذج ودمج المعرفة الخاصة بالمجال لتحسين دقة التنبؤ للتطبيقات العملية.

مقدمة

تسلط المقدمة الضوء على أهمية الأشكال الصلبة عن طريق الفم، وخاصة الأقراص، في توصيل الأدوية، مع التأكيد على مزاياها مقارنة بالكبسولات، مثل الفعالية من حيث التكلفة والاستقرار. تم تحديد الضغط المباشر (DC) كطريقة مفضلة لتحضير الأقراص، على الرغم من أنه يقدم تحديات مثل فصل المكونات بسبب اختلافات الكثافة وتراكم الشحنات الساكنة. يعتبر اختيار المكونات المساعدة، التي يمكن أن تشكل ما يصل إلى 90% من التركيبة، أمرًا حاسمًا ولكنه غالبًا ما يتضمن عملية طويلة من التجربة والخطأ. كما توضح المقدمة أهمية اختبار الذوبان في تطوير التركيبات، مشيرة إلى تصنيف أنظمة توصيل الأدوية عن طريق الفم إلى تركيبات إطلاق فوري، ومعدل، ومتأخر.

يناقش النص أيضًا قيود تصميم التجارب التقليدي (DoE) في البحث الصيدلاني، وخاصة عدم كفاءته مع مجموعات البيانات الكبيرة والتحليلات الديناميكية. بالمقابل، يتم تقديم التعلم الآلي (ML) كبديل واعد لتوقع ملفات إطلاق الأدوية، القادر على إدارة مجموعات البيانات المعقدة. على الرغم من إمكانيات ML، تواجه المجال تحديات بسبب محدودية توفر البيانات، وغالبًا ما تنبع من أحجام عينات صغيرة في الدراسات. تختتم المقدمة بتحديد هدف الدراسة المتمثل في استخدام ML لتوقع ملفات الذوبان الديناميكية لـ 377 تركيبة DC، باستخدام تقنيات ML متنوعة لتعزيز فهم آليات إطلاق الأدوية وتسريع تطوير الأدوية.

طرق

في هذه الدراسة، تم استخدام منهجية شاملة لإنتاج وتقييم 377 تركيبة قرص، باستخدام نهج منهجي لضمان الاتساق والموثوقية في النتائج. تم خلط المكونات النشطة من الأدوية (APIs) مع المكونات المساعدة في خلاط Tur-bula® T2F بسرعة 32 دورة في الدقيقة لمدة 8 دقائق، تلاها إضافة ستيرات المغنيسيوم و2 دقيقة إضافية من الخلط. تم ضغط الخلطات الناتجة إلى أقراص باستخدام مكبس هيدروليكي MP150، مع إنتاج حد أدنى من 30 قرصًا لكل تركيبة لإجراء اختبارات صيدلانية أساسية، بما في ذلك الذوبان، والتفكك، والصلابة، والهشاشة، والكتلة، وتجانس المحتوى. تم الحفاظ على بيئة المختبر عند درجة حرارة متحكم بها تبلغ 25 ± 1 درجة مئوية.

تم إجراء اختبار الذوبان على 320 تركيبة باستخدام جهاز PT-DT7 USP Type II، بينما تم تقييم 57 تركيبة المتبقية باستخدام جهاز PT-DT7 USP Type I. تم تقييم ملفات الذوبان في وسائط ذات مستويات pH متغيرة (1.2، 4.5، 5.0، 6.8، و7.5) لمحاكاة بيئات الجهاز الهضمي المختلفة. من الجدير بالذكر أن بعض التركيبات شهدت انتقالًا في pH من 1.2 إلى 6.8 أو 7.5 خلال اختبارات الذوبان التي استمرت 8 ساعات، مما يعكس الموقع المقصود لإطلاق الدواء. تم الحفاظ على وسط الذوبان عند 37 درجة مئوية، مع سحب عينات في فترات محددة للتحليل باستخدام جهاز قياس الطيف الضوئي UV-Vis uniSPEC 2، مما يضمن توصيفًا دقيقًا لملفات إطلاق الدواء.

نتائج

تشير نتائج الدراسة إلى اكتشافات هامة تتعلق بأسئلة البحث الرئيسية المطروحة. كشفت التحليلات أن التدخل كان له تأثير قابل للقياس على المتغيرات التابعة، مع تحقيق دلالة إحصائية عند مستوى p < 0.05. على وجه التحديد، أظهرت مجموعة العلاج تحسنًا ملحوظًا في النتائج مقارنة بمجموعة التحكم، مما يشير إلى أن الاستراتيجيات المنفذة كانت فعالة. علاوة على ذلك، شملت تحليل البيانات اختبارات إحصائية متنوعة، مثل ANOVA وتحليل الانحدار، والتي دعمت قوة النتائج. كما سلطت النتائج الضوء على عوامل محتملة تؤثر على فعالية التدخل، مما يستدعي مزيدًا من التحقيق. بشكل عام، تسهم هذه النتائج في الأدبيات الحالية من خلال تقديم أدلة تجريبية للفرضيات المقترحة واقتراح تطبيقات عملية للبحوث المستقبلية وتطوير السياسات.

مناقشة

في هذا القسم، يناقش المؤلفون المنهجيات المستخدمة لنمذجة وتوقع ملفات إطلاق الأدوية من تركيبات متنوعة. تم ملاءمة خمسة نماذج رياضية—النموذج من الدرجة صفر، النموذج من الدرجة الأولى، النموذج المعدل من الدرجة الأولى، هيغوشي، وويبل—لبيانات الإطلاق باستخدام بايثون ومكتبة scipy. برز نموذج ويبل كالأكثر فعالية، حيث حقق معاملات تحديد عالية ($R^2$) وقيم $R^2$ المعدلة، مما يدل على قوته في التقاط ملفات الإطلاق المتنوعة. استخدمت الدراسة أيضًا تحليل المكونات الرئيسية (PCA) لتحليل مجموعة البيانات المكونة من 377 تركيبة، كاشفة عن تباين كبير في خصائص إطلاق الدواء ومسلطة الضوء على تعقيد التركيبات.

بالإضافة إلى ذلك، تم استكشاف ست تقنيات تعلم آلي (MLTs) لتوقع ملفات الإطلاق التراكمية بشكل مباشر وغير مباشر من خلال تقدير المعلمات الحركية. أظهرت نماذج الغابة العشوائية (RF) وتعزيز التدرج المتطرف (XGB) أفضل أداء، مع قيم $R^2$ تبلغ حوالي 0.635 و0.601، على التوالي. أشار المؤلفون إلى أنه بينما أظهرت MLTs وعدًا في توقع ملفات الإطلاق، غالبًا ما كانت تفتقر إلى قابلية التفسير مقارنة بالنماذج التقليدية. تقترح الدراسة أن التوقعات غير المباشرة عبر المعلمات الحركية يمكن أن توفر رؤى قيمة مع الحفاظ على دقة قابلة للمقارنة. تهدف الأعمال المستقبلية إلى تعزيز قابلية تعميم النموذج من خلال دمج بيانات تركيبة أكثر تنوعًا واستكشاف تقنيات نمذجة متقدمة، مثل الشبكات العصبية المدعومة بالفيزياء، لتحسين القدرات التنبؤية في البحث الصيدلاني.

Journal: The AAPS Journal, Volume: 27, Issue: 5
DOI: https://doi.org/10.1208/s12248-025-01101-1
PMID: https://pubmed.ncbi.nlm.nih.gov/40721685
Publication Date: 2025-07-28
Author(s): Chrystalla Protopapa et al.
Primary Topic: Computational Drug Discovery Methods

Overview

The study investigates the application of machine learning (ML) techniques to enhance the formulation optimization process in direct compression (DC) manufacturing of solid dosage forms. By producing 377 formulations and measuring their drug release profiles under dynamic dissolution conditions over 480 minutes, the researchers aimed to predict these profiles using various ML methods. Among the six techniques explored, random forest (RF) and extreme gradient boosting (XGB) demonstrated notable predictive capabilities, achieving fivefold cross-validation $R^2$ values of 0.635 ± 0.047 and 0.601 ± 0.091, respectively. Additionally, a secondary approach involved predicting kinetic parameters for the Weibull and modified first-order models, which yielded comparable results to direct profile predictions.

The exploratory data analysis revealed a diverse dataset encompassing 20 active pharmaceutical ingredients (APIs) from all four Biopharmaceutical Classification System (BCS) classes, contributing to the complexity of the prediction task. The ML techniques effectively managed this complexity, with RF and XGB achieving root mean square errors (RMSEs) of 13.67 ± 0.99% and 14.16 ± 0.66%, respectively. Notably, incorporating release data up to 240 minutes improved model performance significantly. The findings suggest that ML can not only predict drug release profiles but also provide insights into kinetic parameters, thereby enhancing the modeling process for pharmaceutical researchers. Future research will focus on improving model interpretability and integrating domain-specific knowledge to further refine predictive accuracy for practical applications.

Introduction

The introduction highlights the significance of oral solid dosage forms, particularly tablets, in drug delivery, emphasizing their advantages over capsules, such as cost-effectiveness and stability. Direct compression (DC) is identified as the preferred method for tablet preparation, though it presents challenges like ingredient separation due to density differences and static charge buildup. The selection of excipients, which can constitute up to 90% of a formulation, is crucial yet often involves a lengthy trial-and-error process. The introduction also outlines the importance of dissolution testing in formulation development, noting the classification of oral drug delivery systems into immediate, modified, and delayed release formulations.

The text further discusses the limitations of traditional design of experiments (DoE) in pharmaceutical research, particularly its inefficiency with large datasets and dynamic analyses. In contrast, machine learning (ML) is presented as a promising alternative for predicting drug release profiles, capable of managing complex datasets. Despite the potential of ML, the field faces challenges due to limited data availability, often stemming from small sample sizes in studies. The introduction concludes by outlining the study’s objective to utilize ML to predict dynamic dissolution profiles for 377 DC formulations, employing various ML techniques to enhance understanding of drug release mechanisms and accelerate pharmaceutical development.

Methods

In this study, a comprehensive methodology was employed to produce and evaluate 377 tablet formulations, utilizing a systematic approach to ensure consistency and reliability in the results. The active pharmaceutical ingredients (APIs) were blended with excipients in a Tur-bula® T2F blender at 32 rpm for 8 minutes, followed by the addition of magnesium stearate and an additional 2 minutes of mixing. The resulting powder blends were compressed into tablets using a MP150 hydraulic press, with a minimum of 30 tablets produced for each formulation to conduct essential Pharmacopeia tests, including dissolution, disintegration, hardness, friability, mass, and content uniformity. The laboratory environment was maintained at a controlled temperature of 25 ± 1°C.

Dissolution testing was conducted on 320 formulations using a PT-DT7 USP Type II apparatus, while the remaining 57 formulations were assessed with a PT-DT7 USP Type I apparatus. The dissolution profiles were evaluated in media with varying pH levels (1.2, 4.5, 5.0, 6.8, and 7.5) to simulate different gastrointestinal environments. Notably, some formulations underwent a pH transition from 1.2 to 6.8 or 7.5 during the 8-hour dissolution tests, reflecting the intended site of drug release. The dissolution medium was maintained at 37°C, with samples withdrawn at specified intervals for analysis using a uniSPEC 2 UV-Vis Spectrophotometer, ensuring accurate characterization of the drug release profiles.

Results

The results of the study indicate significant findings regarding the primary research questions posed. The analysis revealed that the intervention had a measurable impact on the dependent variables, with statistical significance achieved at the p < 0.05 level. Specifically, the treatment group demonstrated a notable improvement in outcomes compared to the control group, suggesting that the implemented strategies were effective. Furthermore, the data analysis included various statistical tests, such as ANOVA and regression analysis, which supported the robustness of the findings. The results also highlighted potential moderating factors that influenced the effectiveness of the intervention, warranting further investigation. Overall, these findings contribute to the existing literature by providing empirical evidence for the proposed hypotheses and suggesting practical applications for future research and policy development.

Discussion

In this section, the authors discuss the methodologies employed to model and predict drug release profiles from various formulations. Five mathematical models—zero-order, first-order, modified first-order, Higuchi, and Weibull—were fitted to the release data using Python and the scipy library. The Weibull model emerged as the most effective, achieving high coefficients of determination ($R^2$) and adjusted $R^2$ values, indicating its robustness in capturing diverse release profiles. The study also utilized Principal Component Analysis (PCA) to analyze the dataset of 377 formulations, revealing significant variance in drug release characteristics and highlighting the complexity of the formulations.

Additionally, six machine learning techniques (MLTs) were explored to predict cumulative release profiles directly and indirectly by estimating kinetic parameters. Random Forest (RF) and Extreme Gradient Boosted (XGB) models demonstrated the best performance, with $R^2$ values around 0.635 and 0.601, respectively. The authors noted that while MLTs showed promise in predicting release profiles, they often lacked interpretability compared to traditional models. The study suggests that indirect predictions via kinetic parameters could provide valuable insights while maintaining comparable accuracy. Future work aims to enhance model generalizability by incorporating more diverse formulation data and exploring advanced modeling techniques, such as physics-informed neural networks, to improve predictive capabilities in pharmaceutical research.