DOI: https://doi.org/10.1016/j.physletb.2025.140146
تاريخ النشر: 2026-01-05
المؤلف: Zhenyun Du
الموضوع الرئيسي: أنظمة الكم ذات الجسيمات المتعددة
نظرة عامة
في هذه الدراسة، نحقق في الشبكات العصبية ذات القيم المعقدة (CVNNs) التي تستخدم أوزان خفية إلى مخرجات ذات قيم تينسور ضمن إطار نظرية الحقل الكمومي للشبكة العصبية (NN-QFT). بالنسبة لـ CVNNs التقليدية ذات الأوزان القياسية، نستخرج الوظيفة المولدة ونحدد العملية الغاوسية المقابلة في حد العرض اللانهائي، جنبًا إلى جنب مع حالتها الكمومية الفعالة. عندما يتم توسيع أوزان الطبقة الأخيرة إلى تينسورات ذات جبر كليفورد، تصبح مخرجات الشبكة ذات قيم مصفوفة معقدة، مما يقدم هيكل إشارة شبيه بالفيرميون في دوال الارتباط ذات العرض الكبير.
تظهر نتائجنا أنه في حد العرض اللانهائي، تلتزم المرافقات التي تحتوي على أعداد متساوية من عمليات الإنشاء ($f^\dagger$) والدمار ($f$) بقواعد ويك الفيرميونية ويمكن التعبير عنها كحُدود مشتقة من نواة إقليدية قياسية $S(x, y) = \langle f^\dagger(x) f(y) \rangle$. هذا يؤسس لتمديد هيكلي ذو إشارة لـ NN-QFT فيما يتعلق بالمرافقات الإقليدية وقواعد فاينمان، على الرغم من غياب تمثيل تكامل مسار غراسمان المجهري لبارامترات الشبكة. وبالتالي، تقدم تحليلاتنا تطابق NN-QFT إلى ما هو أبعد من الحقول الغاوسية البوسونية فقط وتقترح مسارًا محتملاً لإدماج تماثلات شبيهة بالفيرميون في الهياكل العصبية ذات الصلة بنظرية الحقل الكمومي.
مقدمة
تؤسس مقدمة هذه الورقة البحثية ارتباطًا صارمًا بين الشبكات العصبية الواسعة ذات الأوزان العشوائية الغاوسية المستقلة والمتطابقة التوزيع (i.i.d.) ونظريات الحقل الكمومي البوسونية الحرة، والتي تُسمى نظرية الحقل الكمومي للشبكة العصبية (NN-QFT). تبرز أن دالة الارتباط من الدرجة $n$ لمخرجات الشبكة يمكن التعبير عنها من خلال مجموع على مخططات فاينمان البوسونية ذات النقاط $n$، مع تمثيل مخرجات الشبكة كدالة لمواقع الزمان والمكان وتحقيقات الأوزان العشوائية. يركز المؤلفون على بنية ذات طبقة خفية واحدة، مستخدمين دالة تنشيط أسية تقوم بتطبيع المتوسط قبل التنشيط إلى صفر تحت مجموعة غاوسية. مع اقتراب عرض الطبقة الخفية من اللانهاية، يبسط لاغرانجيان الفعالة للشبكة إلى تلك الخاصة بحقل قياسي حر، مع بقاء الدالة الناقلة ذات النقاط الثنائية فقط ذات أهمية.
تستكشف الورقة أيضًا ديناميات الشبكات ذات الطبقات الخفية الواسعة ولكن المحدودة، كاشفة أن التصحيحات الرائدة للاغرانجيان الحر تتنظم في نظرية فعالة ذات طاقة منخفضة تتميز بحد تفاعل رباعي. ومع ذلك، بالنسبة للشبكات ذات الطبقات الخفية الأضيق، تفشل التقريب الرباعي، مما يؤدي إلى تسلسل معقد من حدود التفاعل. يقترح المؤلفون نهجًا جديدًا للانتقال من الإحصائيات البوسونية إلى الإحصائيات الفيرميونية من خلال استخدام معاملات ذات قيم تينسور تفرض عدم التبادلية بين مكونات الوزن، مما يمكّن من بناء بنية عصبية تمثل بشكل جوهري نظرية حقل كمومي فيرميونية. لا يقتصر هذا العمل على توسيع إطار NN-QFT إلى ما هو أبعد من الحقول البوسونية فحسب، بل يعزز أيضًا تكاملًا أعمق لتقنيات التعلم الآلي مع النظريات الفيزيائية، مما يمهد الطريق للتقدمات المستقبلية بين التخصصات.
نقاش
تتناول قسم النقاش في الورقة الإطار النظري الذي يربط الشبكات العصبية ذات القيم المعقدة (CVNNs) بنظرية الحقل الكمومي (QFT). من خلال توسيع بارامترات الشبكة العصبية إلى المستوى المعقد، يتم التعامل مع كل وزن وانحياز كمزيج من مكونات حقيقية وتخييلية مستقلة مأخوذة من توزيعات غاوسية. يؤدي ذلك إلى وظيفة مولدة يمكن تفسيرها كتكامل مسار منفصل، مما يسهل حساب دوال الارتباط من خلال حقل مصدر مساعد. يستخرج المؤلفون دالة المخرجات لـ CVNN ويعبرون عن الوظيفة المولدة كتكامل مسار، مما يسمح بحساب دوال الارتباط عبر مشتقات وظيفية.
في حد العرض اللانهائي، يُظهر أن مخرجات الشبكة تتقارب إلى توزيع شبيه بالغوس، مع كشف دوال الارتباط عن هيكل مشابه لنظريات الحقول الحرة. تستكشف الورقة أيضًا تداعيات ترقية أوزان الطبقة الأخيرة إلى كائنات تينسور، مما يؤدي إلى هياكل ارتباط فيرميونية تلتزم بنظرية ويك. لا يوفر هذا الإطار رؤى حول سلوك CVNNs في سياق QFT فحسب، بل يقترح أيضًا تطبيقات محتملة في محاكاة أنظمة الكم ذات الجسيمات المتعددة. يعترف المؤلفون أنه على الرغم من أن البنى النظرية قوية، إلا أن التطبيقات العملية قد تواجه تحديات بسبب التقلبات غير الغاوسية وتأثيرات العرض المحدود، مما يشير إلى طرق للبحث المستقبلي في كل من المجالات النظرية والتطبيقية.
DOI: https://doi.org/10.1016/j.physletb.2025.140146
Publication Date: 2026-01-05
Author(s): Zhenyun Du
Primary Topic: Quantum many-body systems
Overview
In this study, we investigate complex-valued neural networks (CVNNs) that utilize tensor-valued hidden-to-output weights within the neural-network quantum field theory (NN-QFT) framework. For conventional CVNNs with scalar weights, we derive the generating functional and identify the corresponding Gaussian process in the infinite-width limit, along with its effective quantum state. When the last-layer weights are extended to Clifford-algebra-valued tensors, the output of the network becomes complex matrix-valued, introducing a fermion-like sign structure in the large-width correlation functions.
Our findings reveal that, in the infinite-width limit, correlators containing equal numbers of creation ($f^\dagger$) and annihilation ($f$) operators adhere to fermionic Wick rules and can be expressed as determinants derived from a scalar Euclidean kernel $S(x, y) = \langle f^\dagger(x) f(y) \rangle$. This establishes a sign-structured extension of NN-QFT concerning Euclidean correlators and Feynman rules, despite the absence of a microscopic Grassmann path integral representation for the network parameters. Consequently, our analysis advances the NN-QFT correspondence beyond solely bosonic Gaussian fields and proposes a potential pathway for incorporating fermion-like symmetries into neural architectures relevant to quantum field theory.
Introduction
The introduction of this research paper establishes a rigorous connection between wide neural networks with independent and identically distributed (i.i.d.) random Gaussian weights and free bosonic quantum field theories, termed neural-network quantum field theory (NN-QFT). It highlights that the $n$-th order correlation function of the network output can be expressed through a sum over bosonic $n$-point Feynman diagrams, with the output of the network represented as a function of space-time positions and random weight realizations. The authors focus on a single-hidden-layer architecture, employing an exponential activation function that normalizes the mean pre-activation to zero under the Gaussian ensemble. As the width of the hidden layer approaches infinity, the network’s effective Lagrangian simplifies to that of a free scalar field, with only the two-point propagator remaining significant.
The paper further explores the dynamics of networks with finite yet wide hidden layers, revealing that the leading corrections to the free Lagrangian organize into a low-energy effective theory characterized by a quartic interaction term. However, for networks with narrower hidden layers, the quartic approximation fails, leading to a complex hierarchy of interaction terms. The authors propose a novel approach to transition from bosonic to fermionic statistics by employing tensor-valued coefficients that enforce anticommutation among weight components, thereby enabling the construction of a neural architecture that intrinsically represents a fermionic quantum field theory. This work not only extends the NN-QFT framework beyond bosonic fields but also fosters a deeper integration of machine learning techniques with physical theories, paving the way for future interdisciplinary advancements.
Discussion
The discussion section of the paper elaborates on the theoretical framework connecting complex-valued neural networks (CVNNs) to quantum field theory (QFT). By extending the neural network’s parameters into the complex plane, each weight and bias is treated as a combination of independent real and imaginary components sampled from Gaussian distributions. This leads to a generating functional that can be interpreted as a discrete path integral, facilitating the computation of correlation functions through an auxiliary source field. The authors derive the output function of the CVNN and express the generating functional as a path integral, allowing for the calculation of correlation functions via functional derivatives.
In the infinite-width limit, the network’s output is shown to converge to a Gaussian-like distribution, with the correlation functions revealing a structure akin to free-field theories. The paper further explores the implications of promoting the last-layer weights to tensor objects, resulting in fermionic correlation structures that adhere to Wick’s theorem. This framework not only provides insights into the behavior of CVNNs in the context of QFT but also suggests potential applications in simulating quantum many-body systems. The authors acknowledge that while the theoretical constructs are robust, practical implementations may face challenges due to non-Gaussian fluctuations and finite-width effects, indicating avenues for future research in both theoretical and applied domains.
