معايرة عدم اليقين المرنة للجهود بين الذرات المستندة إلى التعلم الآلي
Flexible uncertainty calibration for machine-learned interatomic potentials

المجلة: npj Computational Materials
DOI: https://doi.org/10.1038/s41524-026-02080-3
تاريخ النشر: 2026-04-27
المؤلف: Cheuk Hin Ho وآخرون
الموضوع الرئيسي: القياس العلمي وتقييم عدم اليقين

نظرة عامة

تقدم هذه القسم إطارًا جديدًا لتقدير عدم اليقين بشكل موثوق (UQ) في الإمكانيات بين الذرات المستندة إلى التعلم الآلي (MLIPs)، وهو أمر حاسم لمحاكاة الذرات التنبؤية. ينتقد المؤلفون طرق التنبؤ المتوافق الحالية (CP) بسبب قيودها في الدقة، وقابلية التوسع، والتكيف مع البيئات الذرية المعقدة. لمعالجة هذه القضايا، يقترحون إطارًا مرنًا لمعايرة عدم اليقين يعيد صياغة CP كمشكلة تحسين معلمة، مما يسمح بالتعلم المباشر لوظائف الكوانتيل المعتمدة على البيئة. تؤدي هذه الطريقة إلى فترات تنبؤية أكثر حدة وتكيفًا مع الحد الأدنى من العبء الحسابي.

باستخدام نموذج الأساس MACE-MP-0، يتحقق المؤلفون من إطارهم عبر مجموعة متنوعة من المعايير، بما في ذلك البلورات الأيونية، والأسطح الحفازة، والأنظمة الجزيئية. تشير نتائجهم إلى تحسينات كبيرة في ارتباط عدم اليقين بالخطأ، وتحسين تحديد التكوينات عالية الخطأ للتعلم النشط، وقابلية موثوقة للنقل عبر مختلف الوظائف التبادلية-التبادلية. يتميز الإطار المقترح بعموميته، وكفاءة البيانات، والتوافق مع مختلف هياكل MLIP وطرق UQ الأساسية، مما يوفر حلاً عمليًا لتحقيق محاكاة ذرية قوية وقابلة للنقل.

طرق

في هذا القسم، يقدم المؤلفون طرقًا جديدة لمعايرة تقديرات عدم اليقين الاستدلالية في توقعات الإمكانيات بين الذرات المستندة إلى التعلم الآلي (MLIPs). يبدأون بتوضيح مبادئ التنبؤ المتوافق العادي، الذي يعمل كأساس للنقاشات اللاحقة. ثم يوسع المؤلفون هذا الإطار إلى التنبؤ المتوافق القائم على الفئات، الذي يهدف إلى معالجة التحولات المتغيرة التي قد تحدث في توزيعات الاختبار.

استنادًا إلى هذه المفاهيم، يقترح المؤلفون نهجًا جديدًا لمعايرة عدم اليقين، والذي، على الرغم من استلهامه من التنبؤ المتوافق، يعمل خارج حدوده التقليدية. يتم تطبيق هذه الطريقة بشكل خاص لمعايرة عدم اليقين في القوى داخل MLIPs، مما يوضح فعاليتها في تحسين موثوقية التوقعات في هذا السياق.

نتائج

في هذا القسم، يقدم المؤلفون نتائج إطارهم لمعايرة عدم اليقين، الذي تم تقييمه من خلال سلسلة من التجارب العددية باستخدام بنية MACE. تعزز MACE، التي تحسن من توسيع الكتل الذرية (ACE) من خلال دمج تمرير الرسائل المتساوي من الدرجة الأعلى، كأساس لاختباراتهم. تستخدم التجارب نموذج MACE-MP-0b3، المدرب على مجموعة بيانات MPtraj، جنبًا إلى جنب مع تقديرات عدم اليقين المستندة إلى LLPR كأساس. يتم هيكلة التقييم في أربع مراحل متميزة: (1) تقييم الأداء الأساسي على مجموعات بيانات مختلفة وكفاءة حسابية؛ (2) اختبار التعميم على البيئات الذرية غير المرئية في التفاعلات الحفازة؛ (3) إظهار فائدة عدم اليقين المعاير في توجيه الضبط الدقيق لمحاكاة الديناميات الجزيئية؛ و (4) فحص قابلية نقل عدم اليقين المعاير عبر وظائف التبادلية-التبادلية المختلفة.

يقارن المؤلفون ثلاث استراتيجيات للمعايرة: احتمال الشرط العادي (CP)، الذي يستهدف الوسيط الشرطي مع كوانتيل عالمي؛ CP القائم على الفئات، الذي يصنف البيئات الذرية المحلية إلى مجموعات منفصلة باستخدام نموذج خلط غاوسي؛ ومعايرة عدم اليقين المرنة (UC) المقترحة، التي تستخدم شبكة عصبية أمامية لضبط تقدير عدم اليقين الأساسي. تشير النتائج إلى أن نهج UC المرن يعزز بشكل فعال معايرة عدم اليقين، خاصة في البيئات المتنوعة، بينما يوفر أداءً قويًا عبر مهام مختلفة. تتوفر تفاصيل التنفيذ الدقيقة في المعلومات التكميلية.

نقاش

في هذا القسم، يقدم المؤلفون إطارًا مرنًا لمعايرة عدم اليقين للإمكانيات بين الذرات المستندة إلى التعلم الآلي (MLIPs)، المطبق بشكل خاص على نموذج الأساس MACE-MP-0. يعزز الإطار من معايرة تقديرات عدم اليقين المستمدة من الأساس LLPR دون الحاجة إلى تدريب إضافي، مع التركيز بدلاً من ذلك على التعديلات اللاحقة. تظهر التقييمات الأولية باستخدام مجموعة بيانات LiCl أن طريقة المعايرة المرنة المقترحة تحسن بشكل كبير من التوافق بين عدم اليقين المتوقع والأخطاء الفعلية، محققة معامل ارتباط ترتيب سبيرمان قدره $\rho = 0.589$، وهو تحسين بنسبة 53% عن الأساس. تلتقط هذه الطريقة أنماط الخطأ المحلية بشكل فعال، متفوقة على الطرق التقليدية للمعايرة، خاصة في الحالات التي ترتبط فيها أخطاء التنبؤ بقوة مع الهياكل الذرية المحلية.

تتمتع قوة الإطار بمزيد من التحقق من خلال الاختبارات على مجموعات بيانات أكبر، بما في ذلك MPtraj وMATPES، وعلى مسارات التفاعل الحفازة التي تشمل الأسطح المدعومة بالبلاتين. تشير النتائج إلى أن طريقة المعايرة المرنة تحافظ على أداء قوي حتى في التكوينات غير المرئية، مع معامل ارتباط بيرسون قدره 0.677 للأسطح المدعومة بالبلاتين، مما يظهر قدرتها على التعميم عبر تركيبات كيميائية متنوعة. بالإضافة إلى ذلك، تظهر الطريقة كفاءة عالية، حيث تساهم فقط بنسبة 0.02% من إجمالي وقت التقييم، مما يجعلها مناسبة لمحاكاة الديناميات الجزيئية على نطاق واسع. يستنتج المؤلفون أن هذا الإطار المرن لمعايرة عدم اليقين يؤسس نهجًا عمليًا لتحسين موثوقية MLIPs، مما يمهد الطريق لمحاكاة ذرية مدركة لعدم اليقين وعمليات التعلم النشط.

Journal: npj Computational Materials
DOI: https://doi.org/10.1038/s41524-026-02080-3
Publication Date: 2026-04-27
Author(s): Cheuk Hin Ho et al.
Primary Topic: Scientific Measurement and Uncertainty Evaluation

Overview

The section presents a novel framework for reliable uncertainty quantification (UQ) in machine-learned interatomic potentials (MLIPs), which is crucial for predictive atomistic simulations. The authors critique existing conformal prediction (CP) methods for their limitations in accuracy, scalability, and adaptability to complex atomic environments. To address these issues, they propose a flexible uncertainty calibration framework that reformulates CP as a parameterized optimization problem, allowing for the direct learning of environment-dependent quantile functions. This approach results in sharper and more adaptive predictive intervals with minimal computational overhead.

Using the foundation model MACE-MP-0, the authors validate their framework across various benchmarks, including ionic crystals, catalytic surfaces, and molecular systems. Their findings indicate significant enhancements in uncertainty-error correlation, improved identification of high-error configurations for active learning, and reliable transferability across different exchange-correlation functionals. The proposed framework is characterized by its generality, data efficiency, and compatibility with various MLIP architectures and baseline UQ methods, thus providing a practical solution for achieving robust and transferable atomistic simulations.

Methods

In this section, the authors introduce novel methods for calibrating heuristic uncertainty estimates in Machine Learning Interatomic Potentials (MLIPs) predictions. They start by outlining the principles of regular conformal prediction, which serves as a foundation for the subsequent discussions. The authors then extend this framework to class-based conformal prediction, aimed at addressing covariate shifts that may occur in testing distributions.

Building on these concepts, the authors propose a new approach for uncertainty calibration, which, while inspired by conformal prediction, operates outside its traditional boundaries. This method is specifically applied to calibrate forces uncertainty within MLIPs, demonstrating its effectiveness in improving the reliability of predictions in this context.

Results

In this section, the authors present the results of their uncertainty calibration framework, evaluated through a series of numerical experiments using the MACE architecture. MACE, which enhances the Atomic Cluster Expansion (ACE) by integrating higher-order equivariant message passing, serves as the foundation for their tests. The experiments utilize the MACE-MP-0b3 model, trained on the MPtraj dataset, alongside LLPR-based uncertainty estimates as a baseline. The evaluation is structured into four distinct stages: (1) assessing baseline performance on various datasets and computational efficiency; (2) testing generalization to unseen atomic environments in catalytic reactions; (3) demonstrating the utility of calibrated uncertainties in guiding fine-tuning for molecular dynamics simulations; and (4) examining the transferability of calibrated uncertainties across different exchange-correlation functionals.

The authors compare three calibration strategies: Regular Conditional Probability (CP), which targets the conditional median with a global quantile; Class-based CP, which categorizes local atomic environments into discrete groups using a Gaussian mixture model; and their proposed Flexible Uncertainty Calibration (UC), which employs a feedforward neural network to adjust the baseline uncertainty estimate. The findings indicate that the Flexible UC approach effectively enhances uncertainty calibration, particularly in diverse environments, while providing robust performance across various tasks. Detailed implementation specifics are available in the supplementary information.

Discussion

In this section, the authors present a flexible uncertainty calibration framework for machine learning interatomic potentials (MLIPs), specifically applied to the MACE-MP-0 foundation model. The framework enhances the calibration of uncertainty estimates derived from the LLPR baseline without requiring additional training, focusing instead on post hoc adjustments. Initial evaluations using the LiCl dataset demonstrate that the proposed flexible calibration method significantly improves the alignment between predicted uncertainties and actual errors, achieving a Spearman rank correlation coefficient of $\rho = 0.589$, a 53% improvement over the baseline. This method effectively captures local error patterns, outperforming traditional calibration approaches, particularly in cases where prediction errors correlate strongly with local atomic structures.

The framework’s robustness is further validated through tests on larger datasets, including MPtraj and MATPES, and on catalytic reaction pathways involving Pt-doped surfaces. Results indicate that the flexible calibration method maintains strong performance even in unseen configurations, with a Pearson correlation coefficient of 0.677 for Pt-doped surfaces, showcasing its ability to generalize across varying chemical compositions. Additionally, the method exhibits high efficiency, contributing only 0.02% to the total evaluation time, making it suitable for large-scale molecular dynamics simulations. The authors conclude that this flexible uncertainty calibration framework establishes a practical approach for improving the reliability of MLIPs, paving the way for uncertainty-aware atomistic simulations and active learning workflows.