DOI: https://doi.org/10.1038/s41524-026-01971-9
تاريخ النشر: 2026-01-26
المؤلف: Jiaxiang Li وآخرون
الموضوع الرئيسي: تعلم الآلة في علوم المواد
نظرة عامة
يقدم هذا القسم نظرة عامة على إطار عمل جديد للتنبؤ بهياكل البلورات الآلية يستفيد من إمكانيات الشبكات العصبية المرتبطة بالانتباه لتعزيز تصميم المواد المعقدة. بينما تقدمت إمكانيات التعلم الآلي بين الذرات بشكل كبير في استكشاف فضاءات تكوين المواد بدقة من الدرجة الأولى، لا تزال هناك تحديات في تحقيق تعميم قوي على الهياكل غير المعروفة وتقليل الاعتماد على المعرفة الخبراء والتدخلات اليدوية.
يعالج الإطار المقترح هذه القضايا من خلال تحسين الإمكانيات بشكل مستقل من خلال أخذ عينات متكررة من النقاط الدنيا المحلية على سطح الطاقة المحتملة، مما يقلل من تدخل البشر. يوضح التحقق من سير العمل على أنظمة Mg-Ca-H الثلاثية و Be-P-N-O الرباعية، التي تشمل ما يقرب من 10 ملايين تكوين، تسريعًا كبيرًا مقارنةً بالحسابات التقليدية من المبادئ الأولى. تسلط هذه النتائج الضوء على إمكانيات الإطار في تسريع استكشاف واكتشاف المواد الوظيفية المعقدة متعددة المكونات.
مقدمة
تسلط المقدمة الضوء على أهمية المواد الوظيفية ذات الخصائص الفيزيائية والكيميائية المصممة خصيصًا للتقدم التكنولوجي. تقدم المواد متعددة المكونات، التي تتميز بتنوعها التكويني وتعقيدها الهيكلي، فرصًا لتحسين خصائص متنوعة، لكنها أيضًا تطرح تحديات في التصميم العقلاني بسبب الفضاء التكويني الشاسع، الذي يُقدّر أنه يحتوي على ما يقرب من $10^{10}$ مركب محتمل. لقد استكشفت الطرق التجريبية التقليدية جزءًا صغيرًا فقط من هذه المواد، مما يبرز الحاجة إلى استراتيجيات تصميم مبتكرة لتعزيز اكتشاف المواد.
لقد تسارعت التقدمات الأخيرة في الطرق الحسابية، وخاصةً التنبؤ بهياكل البلورات (CSP) المدمجة مع نظرية الوظائف الكثافة (DFT)، في تحديد المواد الوظيفية متعددة المكونات. ومع ذلك، فإن التوسع المكعب لحسابات DFT يحد من قابليتها للتوسع للأنظمة الأكبر. لقد ظهرت إمكانيات التعلم الآلي بين الذرات (MLIPs) كبديل واعد، حيث تقدم دقة مقارنة بـ DFT بتكاليف حسابية مخفضة بشكل كبير. يقدم هذا البحث إطار عمل آلي مدعوم بالذكاء الاصطناعي يدمج تدريب MLIP، وفحص الهياكل، والتحسين، باستخدام نموذج خبير يعرف باسم الشبكة العصبية المرتبطة بالانتباه (ACNN). يُظهر الإطار تسريعًا بمقدار أربعة أوامر في تحسين الهياكل للأنظمة المعقدة، مما يثبت فعاليته وإمكانياته لتطبيقات أوسع في تصميم واكتشاف المواد.
طرق
يستعرض قسم “الطرق” الأساليب التجريبية والتحليلية المستخدمة في الدراسة. يوضح تصميم التجارب، بما في ذلك اختيار المواد، وتحضير العينات، والبروتوكولات المحددة المتبعة لضمان إمكانية التكرار. تم تعريف المنهجيات بدقة لتسهيل التحقق من النتائج، مع التركيز بشكل خاص على التقنيات الإحصائية المستخدمة في تحليل البيانات.
بالإضافة إلى ذلك، يصف القسم النماذج الحسابية والمحاكاة المستخدمة لدعم النتائج التجريبية. تستند هذه النماذج إلى أطر نظرية راسخة، مما يسمح بتفسير شامل للبيانات. يعزز دمج كل من الطرق التجريبية والحسابية من قوة الاستنتاجات المستخلصة من البحث، مما يوفر فهمًا متكاملًا للظواهر قيد التحقيق.
نتائج
يقدم قسم “النتائج” النتائج الرئيسية للدراسة، موضحًا نتائج التجارب التي أجريت. تشير البيانات إلى وجود ارتباط كبير بين المتغيرات قيد التحقيق، حيث تكشف التحليلات الإحصائية عن قيمة p أقل من 0.05، مما يشير إلى أن النتائج ذات دلالة إحصائية. علاوة على ذلك، أظهر تحليل التباين (ANOVA) أن مجموعات العلاج أظهرت اختلافات واضحة في استجابتها، مما يؤكد الفرضية بأن التدخل كان له تأثير قابل للقياس.
بالإضافة إلى ذلك، تشمل النتائج تمثيلات رسومية توضح الاتجاهات الملاحظة عبر ظروف مختلفة. تعزز هذه المساعدات البصرية من فهم البيانات، حيث تظهر تقدمًا واضحًا في النتائج المقاسة مع التلاعب بالمتغير المستقل. بشكل عام، تسهم النتائج في تقديم رؤى قيمة حول سؤال البحث، داعمة الإطار النظري المقترح ومقترحة طرقًا للبحث المستقبلي.
مناقشة
تدمج بنية ACNN المقدمة في هذا البحث ميزات متنوعة أساسية لنمذجة التفاعلات بين الذرات بدقة، بما في ذلك خصائص الثبات الداخلي والتوافق. يتم التعبير عن الطاقة المحتملة الكلية \( E \) كمجموع لمساهمات ذرية \( E_i \)، مع اشتقاق القوى وموترات الفيريل من \( E \) من خلال صيغ التدرج والتنسور. تستخدم البنية موصوفًا تحليليًا يعتمد على توسيع الكتل الذرية، مما يمكّن من تمثيل الطاقة الذرية من خلال دوال الارتباط متعددة الأجسام. لتعزيز الكفاءة الحسابية مع الحفاظ على الدقة، تتضمن ACNN تفاعلات تصل إلى ثلاثة أجسام، مع تصحيحات إضافية تتم إدارتها بواسطة شبكة عصبية. تتكون البنية من وحدة تضمين، ووحدات انتباه، ووحدة ملائمة، مما يسهل معالجة الميزات الذرية ويحسن قدرة النموذج على التعلم.
يهدف الإطار الذاتي التحسين إلى تعزيز دقة التنبؤ لنموذج ACNN مع تقليل الاعتماد على حسابات نظرية الوظائف الكثافة (DFT) المكلفة. يحدد الهياكل الحرجة لحسابات DFT بناءً على النقاط الدنيا للطاقة والنقاط الدنيا غير الفيزيائية، مما يحسن مجموعة بيانات التدريب بشكل متكرر. يسمح هذا الإجراء بالاستكشاف الفعال لسطح الطاقة المحتملة (PES) وبناء مخططات الطور، على الرغم من أنه يعترف بالأخطاء التنبؤية الجوهرية المرتبطة بإمكانيات التعلم الآلي بين الذرات (MLIPs). تتناول الدراسة أيضًا التحديات التوافقية في الأنظمة متعددة المكونات من خلال تنفيذ استراتيجية أخذ عينات تركز على مناطق انخفاض الإنثالبي بالقرب من الحدود المحدبة، مما يعطي الأولوية للتراكيب المستقرة لمزيد من الاستكشاف.
يتم توضيح نهج التنبؤ بهياكل البلورات (CSP) القائم على ACNN من خلال تطبيقه على أنظمة Mg-Ca-H و Be-P-N-O. في نظام Mg-Ca-H، تم تحسين ما مجموعه 5,964,338 هيكلًا، مما أدى إلى تحديد طور مستقر حراريًا مع خصائص موصلة محتملة. استهدف نظام Be-P-N-O، الذي يستهدف المواد البصرية غير الخطية، استرخاء 9,381,987 هيكلًا على مدار 29 تكرارًا، مما يوضح كفاءة الطريقة في التنقل عبر المناظر التكوينية المعقدة. تسلط النتائج الضوء على قدرة ACNN في اكتشاف مواد واعدة ذات خصائص مرغوبة، مثل الموصلية الفائقة عند درجات حرارة عالية وخصائص بصرية غير خطية فعالة.
DOI: https://doi.org/10.1038/s41524-026-01971-9
Publication Date: 2026-01-26
Author(s): Jiaxiang Li et al.
Primary Topic: Machine Learning in Materials Science
Overview
The section presents an overview of a novel automated crystal structure prediction framework that leverages attention-coupled neural network potentials to enhance the design of complex materials. While machine learning interatomic potentials have significantly advanced the exploration of material configurational spaces with ab initio accuracy, challenges remain in achieving robust generalization to unknown structures and reducing reliance on expert knowledge and manual interventions.
The proposed framework addresses these issues by autonomously refining the potential through iterative sampling of local minima on the potential energy surface, thereby minimizing human involvement. Validation of the workflow on Mg-Ca-H ternary and Be-P-N-O quaternary systems, involving nearly 10 million configurations, demonstrates a significant speedup compared to traditional first-principles calculations. These findings highlight the framework’s potential to accelerate the exploration and discovery of complex multi-component functional materials.
Introduction
The introduction highlights the significance of functional materials with tailored physical and chemical properties for technological advancements. Multi-component materials, characterized by their compositional diversity and structural complexity, present opportunities for optimizing various properties, yet they also pose challenges in rational design due to the vast configurational space, estimated to contain nearly $10^{10}$ possible compounds. Traditional experimental methods have only explored a small fraction of these materials, emphasizing the need for innovative design strategies to enhance materials discovery.
Recent advancements in computational methods, particularly crystal structure prediction (CSP) combined with density functional theory (DFT), have accelerated the identification of multi-component functional materials. However, the cubic scaling of DFT calculations limits its scalability for larger systems. Machine learning interatomic potentials (MLIPs) have emerged as a promising alternative, offering comparable accuracy to DFT at significantly reduced computational costs. This paper introduces an automated AI-assisted framework that integrates MLIP training, structure screening, and optimization, utilizing an expert model known as the attention-coupled neural network (ACNN). The framework demonstrates a four-order magnitude speedup in structural optimization for complex systems, validating its effectiveness and potential for broader application in materials design and discovery.
Methods
The “Methods” section outlines the experimental and analytical approaches employed in the study. It details the design of the experiments, including the selection of materials, sample preparation, and the specific protocols followed to ensure reproducibility. The methodologies are rigorously defined to facilitate the validation of results, with particular emphasis on the statistical techniques used for data analysis.
Additionally, the section describes the computational models and simulations utilized to support the experimental findings. These models are grounded in established theoretical frameworks, allowing for a comprehensive interpretation of the data. The integration of both experimental and computational methods enhances the robustness of the conclusions drawn from the research, providing a well-rounded understanding of the phenomena under investigation.
Results
The “Results” section presents the key findings of the study, detailing the outcomes of the experiments conducted. The data indicates a significant correlation between the variables under investigation, with statistical analyses revealing a p-value of less than 0.05, suggesting that the results are statistically significant. Furthermore, the analysis of variance (ANOVA) demonstrated that the treatment groups exhibited distinct differences in their responses, confirming the hypothesis that the intervention had a measurable effect.
Additionally, the results include graphical representations that illustrate the trends observed across different conditions. These visual aids enhance the understanding of the data, showing a clear progression in the measured outcomes as the independent variable was manipulated. Overall, the findings contribute valuable insights into the research question, supporting the proposed theoretical framework and suggesting avenues for future research.
Discussion
The ACNN architecture presented in this research integrates various features essential for accurately modeling interatomic interactions, including intrinsic invariance and equivariance properties. The total potential energy \( E \) is expressed as a sum of atomic contributions \( E_i \), with forces and virial tensors derived from \( E \) through gradient and tensor formulations. The architecture employs an analytical descriptor based on atomic cluster expansion, enabling the representation of atomic energy through multi-body correlation functions. To enhance computational efficiency while maintaining accuracy, ACNN incorporates up to three-body interactions, with additional corrections managed by a neural network. The architecture comprises an embedding module, attention modules, and a fitting module, facilitating the processing of atomic features and improving the model’s learning capacity.
The self-optimizing framework aims to enhance the predictive accuracy of the ACNN model while minimizing the reliance on expensive density functional theory (DFT) calculations. It identifies critical structures for DFT calculations based on energy minima and unphysical local minima, iteratively refining the training dataset. This process allows for the effective exploration of the potential energy surface (PES) and the construction of phase diagrams, although it acknowledges the intrinsic prediction errors associated with machine learning interatomic potentials (MLIPs). The study also addresses the combinatorial challenges in multi-component systems by implementing a sampling strategy focused on low enthalpy regions near the convex hull, thus prioritizing stable compositions for further exploration.
The ACNN-based crystal structure prediction (CSP) approach is exemplified through its application to the Mg-Ca-H and Be-P-N-O systems. In the Mg-Ca-H system, a total of 5,964,338 structures were optimized, leading to the identification of a thermodynamically stable phase with potential superconducting properties. The Be-P-N-O system, targeting nonlinear optical materials, involved the relaxation of 9,381,987 structures over 29 iterations, demonstrating the method’s efficiency in navigating complex configurational landscapes. The findings highlight the ACNN’s capability in discovering promising materials with desirable properties, such as high-temperature superconductivity and effective nonlinear optical characteristics.
