قاعدة بيانات QUEST للطاقة المثارة عالية الدقة
QUEST Database of Highly-Accurate Excitation Energies

المجلة: Journal of Chemical Theory and Computation، المجلد: 21، العدد: 16
DOI: https://doi.org/10.1021/acs.jctc.5c00975
PMID: https://pubmed.ncbi.nlm.nih.gov/40778852
تاريخ النشر: 2025-08-08
المؤلف: Pierre‐François Loos وآخرون
الموضوع الرئيسي: دراسات الفيزياء الكيميائية المتقدمة

نظرة عامة

تقدم الأبحاث قاعدة بيانات quest، التي تجمع التقديرات النظرية الأفضل للطاقة الانتقالية الرأسية (VTEs) لمجموعة واسعة من الحالات المثارة عبر جزيئات مختلفة، totaling 1489 VTEs مستمدة من حسابات aug-cc-pVTZ. تتضمن هذه المجموعة 731 حالة مفردة، 233 حالة مزدوجة، 461 حالة ثلاثية، و64 حالة رباعية، تشمل كل من الانتقالات القيمية وRydberg في الجزيئات التي تحتوي على 1 إلى 16 ذرة غير هيدروجينية. من الجدير بالذكر أن الغالبية العظمى من هذه القيم تعتبر دقيقة كيميائيًا، حيث تقع ضمن ±0.05 eV من تقديرات التفاعل الكامل للتكوين (FCI). تعمل قاعدة البيانات كمعيار لتقييم أداء منهجيات الحالة المثارة المختلفة، وتوفر معلومات دعم واسعة لاختبار النماذج البديلة.

تؤكد مبادرة quest على أهمية مجموعات البيانات المعيارية في نظرية الهيكل الإلكتروني، مما يسهل التحقق من صحة وتهذيب الطرق الحسابية. من خلال استخدام بروتوكول حسابي متسق واستبعاد القيم التجريبية، تضمن المجموعة اتساقًا داخليًا وتخفف من التحيزات الناتجة عن عدم اليقين التجريبي. بالإضافة إلى VTEs، توسعت قاعدة بيانات quest لتشمل طاقات الانتقال 0-0، والإثارات المشحونة، وخصائص الحالة المثارة الأخرى مثل لحظات الانتقال وقوى المذبذب. تم تصميم هذه المورد الشامل لمساعدة الباحثين في تحديد الطرق الحسابية الموثوقة وفهم قيودها، بينما تعزز أيضًا تطوير نماذج تنبؤية لسلوك الحالة المثارة، والتي يمكن تحسينها بواسطة أساليب مدفوعة بالذكاء الاصطناعي. قاعدة بيانات quest متاحة عبر مستودع GitHub مخصص، مما يبرز فائدتها للمجتمع العلمي في تقدم نظرية الهيكل الإلكتروني للحالة المثارة.

مقدمة

تناقش مقدمة هذه الورقة البحثية التقدم في نظريات الهيكل الإلكتروني التي وسعت نطاق المشكلات الكيميائية المتاحة للكيميائيين النظريين. مع تزايد كفاءة ودقة الطرق الجديدة، تبرز الحاجة إلى معيار شامل بسبب التباين في الأداء عبر عائلات الجزيئات المختلفة والخصائص. أحد التحديات الكبيرة في حسابات الحالة المثارة (ES) هو الاعتماد على القيم المرجعية التجريبية، التي غالبًا ما تكون متحيزة نحو الحالات الساطعة المنخفضة ولا تتوافق مباشرة مع التنبؤات النظرية مثل طاقات الانتقال الرأسية (VTEs).

يبرز المؤلفون السياق التاريخي للمعايير، مشيرين إلى مساهمات Roos و Bartlett في التسعينيات، الذين طوروا طرق متعددة المراجع وطرق مرجعية فردية، على التوالي، لحساب VTEs. كانت إنشاء مجموعة واسعة الاستخدام من التقديرات النظرية الأفضل (TBEs) لطاقات الانتقال الرأسية (VTEs) من قبل مجموعة Thiel في عام 2008 لحظة محورية، على الرغم من أن اعتماد مجموعة البيانات على منهجيات متنوعة أدى إلى بعض التناقضات في الدراسات اللاحقة. بناءً على هذا الأساس، يهدف المؤلفون إلى إنشاء مجموعة بيانات معيارية جديدة، تُسمى قاعدة بيانات quest، باستخدام تقنيات حسابية متقدمة لتحقيق الدقة الكيميائية (هامش الخطأ المستهدف 0.05 eV). لا يقتصر هذا الجهد على إعادة زيارة TBEs السابقة مع منهجيات محسنة، بل يتوسع أيضًا في نطاق الهياكل الجزيئية والحالات المثارة المدروسة، مما يوفر مرجعًا شاملاً ومحدثًا لمجتمع الكيمياء النظرية.

النتائج

تقيّم قسم النتائج من الورقة تقارب طرق الكلاستر المترابطة (CC)، وخاصة طرق CCSDTQP و CCS-DTQ، نحو حد التفاعل الكامل للتكوين (FCI). تكشف التحليلات أنه بالنسبة للمركبات الصغيرة حيث تتوفر كل من الطاقات المرجعية الفردية المتقاربة جيدًا وطاقات CCSDTQP، تتماشى نتائج CCS-DTQP عن كثب مع القيم المستخرجة من التفاعل مع التكوين مع اختيار مضطرب (CIPSI)، حيث تظهر متوسط خطأ مطلق (MAE) قدره 0.005 eV عبر 125 حالة. من الجدير بالذكر أنه عند استبعاد الإثارات المزدوجة الحقيقية، يبقى MAE أقل من عتبة 0.050 eV للدقة الكيميائية، مما يشير إلى أن CCS-DTQ قريب من الدقة لمعظم الأنظمة العضوية ذات القشرة المغلقة. ومع ذلك، تتناقص الدقة بالنسبة للإثارات المزدوجة الحقيقية، حيث يرتفع MAE إلى 0.034 eV، مما يبرز ضرورة تضمين الإثارات الرباعية للتنبؤات الدقيقة في مثل هذه الحالات.

تظهر التحليلات الإضافية لطرق CC المختلفة (CC4، CCSDT، و CC3) أن CC4 يقترب بشكل وثيق من CCSDTQ، بينما تنخفض الدقة مع CCSDT و CC3، ومع ذلك، تحافظ جميع الطرق على الانحرافات تحت عتبة الدقة الكيميائية لمعظم الحالات. تسلط الدراسة أيضًا الضوء على أن الأخطاء المرتبطة بـ CC3 و CCSDT تزداد بشكل كبير مع تراجع الطابع الفردي للإثارات المثارة، خاصة بالنسبة للجزيئات الأكبر والأكثر تعقيدًا. في سياق الجذور الحرة، تُظهر طريقة CCS-DTQ مرة أخرى اختلافات ضئيلة عن CCSDTQP، محققة MAE قدره 0.002 eV عبر 295 حالة، على الرغم من أن CC3 تُظهر معدل خطأ أعلى، حيث يتجاوز حوالي 50% من الحالات عتبة 0.050 eV. تؤكد النتائج التحديات التي تطرحها الجذور الحرة وضرورة الإثارات المزدوجة في سيناريوهات معينة، خاصة في الحالات الأرضية المتجانسة، بينما تؤكد موثوقية CCSDTQ للانتقالات في كل من مجموعات القشرة المغلقة والجذور الحرة.

مناقشة

في هذا القسم، يناقش المؤلفون المنهجية المستخدمة لتعريف طاقات الحالة الانتقالية (TBEs) داخل قاعدة بيانات QUEST، مؤكدين على تطبيق تصحيحات مجموعة الأساس الإضافية. يتم إعطاء الصيغة المستخدمة بواسطة

\[
\Delta E_{\text{TBE}}^{\text{Large}} = \Delta E_{\text{High}}^{\text{Small}} + \Delta E_{\text{Low}}^{\text{Large}} – \Delta E_{\text{Low}}^{\text{Small}}.
\]

اختيار مجموعات الأساس أمر حاسم، حيث يتم استخدام مجموعات كبيرة مثل aug-cc-pVTZ (AVTZ) و aug-cc-pVQZ (AVQZ) للحسابات عالية المستوى، بينما تُستخدم مجموعات أصغر مثل aug-cc-pVDZ (AVDZ) و 6-31+G(d) للطرق منخفضة المستوى. يوضح المؤلفون الاستراتيجيات الحسابية لمختلف أحجام الجزيئات، مشيرين إلى أنه بالنسبة للأنظمة الصغيرة، تُستخدم حسابات متقاربة للغاية باستخدام خوارزمية التفاعل مع التكوين باستخدام اختيار مضطرب تم تنفيذه بشكل تكراري (CIPSI) كمرجع. بالنسبة للجزيئات الأكبر، يستخدم المؤلفون طرق الكلاستر المترابطة، مع استراتيجيات محددة لكل من الأنواع ذات القشرة المغلقة والمفتوحة.

كما يبرز المؤلفون أهمية التعرف بدقة على الحالات المثارة (ESs) لتجنب المقارنات غير المناسبة في الدراسات المعيارية. يقدمون مقاييس مفصلة مثل قوى المذبذب والمساهمات المدارية السائدة لتسهيل هذا التعرف. تختتم المناقشة بتقييم الدقة الكيميائية لـ TBEs، مستهدفةً هوامش خطأ أصغر من ±0.050 eV. يعترف المؤلفون بالتحديات في تحقيق هذه الدقة للأنظمة الأكبر والجذور الحرة، حيث يمكن أن تعقد تأثيرات خلط الحالات ومجموعات الأساس التقييمات. بشكل عام، يبرز القسم النهج المنهجي المتبع لضمان TBEs موثوقة ودقيقة داخل قاعدة بيانات QUEST.

Journal: Journal of Chemical Theory and Computation, Volume: 21, Issue: 16
DOI: https://doi.org/10.1021/acs.jctc.5c00975
PMID: https://pubmed.ncbi.nlm.nih.gov/40778852
Publication Date: 2025-08-08
Author(s): Pierre‐François Loos et al.
Primary Topic: Advanced Chemical Physics Studies

Overview

The research presents the quest database, which compiles theoretical best estimates of vertical transition energies (VTEs) for a wide range of excited states across various molecules, totaling 1489 VTEs derived from aug-cc-pVTZ calculations. This dataset includes 731 singlet, 233 doublet, 461 triplet, and 64 quartet states, encompassing both valence and Rydberg transitions in molecules with 1 to 16 non-hydrogen atoms. Notably, the majority of these values are considered chemically accurate, falling within ±0.05 eV of the full configuration interaction (FCI) estimates. The database serves as a benchmark for evaluating the performance of various excited-state methodologies, providing extensive supporting information for testing alternative models.

The quest initiative emphasizes the importance of benchmark datasets in electronic structure theory, facilitating the validation and refinement of computational methods. By employing a consistent computational protocol and excluding experimental values, the dataset ensures internal consistency and mitigates biases from experimental uncertainties. In addition to VTEs, the quest database has expanded to include 0-0 transition energies, charged excitations, and other excited-state properties such as transition dipole moments and oscillator strengths. This comprehensive resource is designed to aid researchers in identifying reliable computational methods and understanding their limitations, while also fostering the development of predictive models for excited-state behavior, potentially enhanced by AI-driven approaches. The quest database is accessible via a dedicated GitHub repository, highlighting its utility for the scientific community in advancing excited-state electronic structure theory.

Introduction

The introduction of this research paper discusses the advancements in electronic structure theories that have broadened the range of chemical problems accessible to theoretical chemists. As new methods become more efficient and accurate, the need for extensive benchmarking arises due to the variability in performance across different molecular families and properties. A significant challenge in excited-state (ES) calculations is the reliance on experimental reference values, which are often biased towards low-lying bright states and do not directly correspond to theoretical predictions like vertical transition energies (VTEs).

The authors highlight the historical context of benchmarking, noting the contributions of Roos and Bartlett in the 1990s, who developed multireference and single-reference methods, respectively, to compute VTEs. The Thiel group’s establishment of a widely used set of theoretical best estimates (TBEs) for VTEs in 2008 marked a pivotal moment, although the dataset’s reliance on varied methodologies has led to some inconsistencies in subsequent studies. Building on this foundation, the authors aim to create a new benchmark dataset, termed the quest database, utilizing advanced computational techniques to achieve chemical accuracy (target error margin of 0.05 eV). This effort not only revisits earlier TBEs with improved methodologies but also expands the range of molecular structures and excited states considered, providing a comprehensive and updated reference for the theoretical chemistry community.

Results

The results section of the paper evaluates the convergence of coupled cluster (CC) methods, particularly the CCSDTQP and CCS-DTQ approaches, toward the full configuration interaction (FCI) limit. The analysis reveals that for small compounds where both well-converged single-reference and CCSDTQP energies are available, the CCS-DTQP results align closely with the extrapolated values from configuration interaction with perturbative selection (CIPSI), exhibiting a mean absolute error (MAE) of 0.005 eV across 125 cases. Notably, when excluding genuine double excitations, the MAE remains below the 0.050 eV threshold for chemical accuracy, indicating that CCS-DTQ is nearly exact for most closed-shell organic systems. However, the accuracy diminishes for genuine double excitations, with the MAE rising to 0.034 eV, underscoring the necessity of including quadruple excitations for accurate predictions in such cases.

Further analysis of various CC methods (CC4, CCSDT, and CC3) shows that CC4 closely approximates CCSDTQ, while the accuracy decreases with CCSDT and CC3, yet all methods maintain deviations below the chemical accuracy threshold for most cases. The study also highlights that the errors associated with CC3 and CCSDT increase significantly as the single-excitation character of excited states diminishes, particularly for larger and more complex molecules. In the context of radicals, the CCS-DTQ method again demonstrates negligible differences from CCSDTQP, achieving a MAE of 0.002 eV over 295 cases, although CC3 shows a higher error rate, with about 50% of cases exceeding the 0.050 eV threshold. The findings emphasize the challenges posed by radicals and the need for double excitations in certain scenarios, particularly in degenerate ground states, while confirming the reliability of CCSDTQ for transitions in both closed-shell and radical subsets.

Discussion

In this section, the authors discuss the methodology used to define transition state energies (TBEs) within the QUEST database, emphasizing the application of additive basis set corrections. The formula used is given by

\[
\Delta E_{\text{TBE}}^{\text{Large}} = \Delta E_{\text{High}}^{\text{Small}} + \Delta E_{\text{Low}}^{\text{Large}} – \Delta E_{\text{Low}}^{\text{Small}}.
\]

The choice of basis sets is critical, with large sets like Dunning’s aug-cc-pVTZ (AVTZ) and aug-cc-pVQZ (AVQZ) being employed for high-level calculations, while smaller sets such as aug-cc-pVDZ (AVDZ) and 6-31+G(d) are used for low-level methods. The authors detail the computational strategies for various molecular sizes, noting that for small systems, highly converged calculations using the Configuration Interaction using a Perturbative Selection made Iteratively (CIPSI) algorithm serve as a reference. For larger molecules, the authors utilize coupled-cluster methods, with specific strategies for both closed-shell and open-shell species.

The authors also highlight the importance of accurately identifying excited states (ESs) to avoid inappropriate comparisons in benchmarking studies. They provide detailed metrics such as oscillator strengths and dominant orbital contributions to facilitate this identification. The discussion concludes with an assessment of the chemical accuracy of the TBEs, aiming for error bars smaller than ±0.050 eV. The authors acknowledge challenges in achieving this accuracy for larger systems and radicals, where state-mixing and basis set effects can complicate assessments. Overall, the section underscores the systematic approach taken to ensure reliable and accurate TBEs within the QUEST database.