DOI: https://doi.org/10.1088/1748-0221/21/01/p01042
تاريخ النشر: 2026-01-01
المؤلف: Thorsten Buss وآخرون
الموضوع الرئيسي: دراسات فيزياء الجسيمات النظرية والتجريبية
نظرة عامة
تقدم البحث تقدمًا في محاكاة زخات الجسيمات في الكالوريترات عالية الحبيبية باستخدام التعلم الآلي، وخاصة من خلال نموذج توليدي قائم على المحولات. يعزز هذا النموذج الهياكل السابقة المصممة لزخات الكهرومغناطيسية من خلال دمج آلية الانتباه، مما يمكّن من توليد زخات هادونية معقدة في كل من الكالوريترات الكهرومغناطيسية (ECal) والهادونية (HCal) في وقت واحد. يمثل هذا النهج علامة فارقة كبيرة حيث إنه أول مثال على استخدام التعلم الآلي لتوليد الزخات بشكل شامل في مثل هذه الأنظمة، مع توفير الكود للجمهور لإجراء المزيد من الأبحاث.
في الخاتمة، يؤكد المؤلفون على ضرورة وجود نماذج توليدية لإدارة تعقيدات الكالوريترات الواقعية بفعالية للانتقال من إثبات المفهوم إلى التطبيقات العملية. تُظهر الدراسة أن النموذج التوليدي القائم على سحابة النقاط يمكنه محاكاة مكونات ECal وHCal بدقة، ملتقطًا خصائص الزخات الفردية وترابطاتها. على الرغم من وجود مجال للتحسين في دقة المخرجات المولدة، لا سيما في الهياكل الشبيهة بالمسارات في HCal، تُظهر النتائج جودة مقارنة أو متفوقة قليلاً على خوارزميات إعادة البناء التقليدية. قد يكون الاستراتيجية المقترحة لشرط نماذج توليدية متعددة بشكل متسلسل لها أيضًا تطبيقات أوسع في مهام المحاكاة المعقدة خارج الكالوريترية.
مقدمة
تستعرض المقدمة ضرورة تطوير بدائل توليدية لتوليد الأحداث ومهام المحاكاة في فيزياء الطاقة العالية، لا سيما من أجل مصادم الهادرونات الكبير (HL-LHC) والدراسات المستقبلية للمصادمات. مع زيادة معدلات الأحداث بسبب اللمعان العالي، من المتوقع أن تتجاوز المتطلبات الحاسوبية لمحاكاة مونت كارلو (MC) عالية الدقة الموارد المتاحة. تقدم النماذج التوليدية، بما في ذلك الشبكات التنافسية التوليدية (GANs)، والمشفرات التلقائية التباينية (VAEs)، ونماذج الانتشار، حلاً قابلاً للتطبيق لتخفيف هذا العبء الحاسوبي. ومع ذلك، ركزت معظم الأبحاث الحالية بشكل أساسي على محاكاة الزخات الكهرومغناطيسية، مع محاولات محدودة لنمذجة الزخات الهادونية الأكثر تعقيدًا.
يقدم هذا العمل نموذج CaloHadronic، وهو إطار عمل جديد للتعلم الآلي التوليدي مصمم لمحاكاة الزخات الهادونية عبر كل من الكالوريترات الكهرومغناطيسية (ECal) والهادونية (HCal). يستخدم النموذج تدفقًا طبيعيًا مستمرًا (CNF) لتحديد عدد النقاط في كل طبقة ويستخدم نماذج EDM-انتشار منفصلة لكل كالوريتر لضمان توليد زخات واقعية تحترم الدقة المكانية والمواد المميزة للكواشف. من خلال شرط توليد HCal على بيانات ECal، يلتقط النموذج بفعالية الانتقال بين الكالوريترات. تمهد المقدمة الطريق لاستكشاف شامل لهندسة النموذج وأدائه في الأقسام اللاحقة، مما يساهم في قدرات المحاكاة لجهاز الكشف الدولي الكبير المخطط له في المصادم الخطي الدولي.
طرق
في هذا القسم، يصف المؤلفون المنهجية المستخدمة لدمج مخرجات النموذج مع مجموعة إعادة البناء القياسية لـ ILD لتحليل زخات الجسيمات. باستخدام مكتبة DDML، يحاكون تفاعل ميزون $\pi^+$ بقدرة 50 GeV، والذي يتم إصداره من مسدس جسيمات يقع عند الإحداثيات (-5، 0، -15) مم في نظام الإحداثيات العالمي لـ ILD. يتم توجيه البيون لضرب وجه الكالوريتر بشكل عمودي، مع الأخذ في الاعتبار انحناء مساره. من الجدير بالذكر أن طاقة البيون تُسجل عند وجه الكالوريتر لتتوافق مع ظروف التدريب، مع ضمان وجود مسار ليتمكن خوارزمية PandoraPFA من إعادة بناء $\pi^+$ بفعالية.
قام المؤلفون بتوليد إجمالي 2000 حدث لكل من Geant4 ونموذج CaloHadronic، مع تطبيق قصات جودة لاحقة على المسارات المعاد بناؤها. أسفر هذا الإجراء عن 1929 حدثًا صالحًا لنموذج CaloHadronic و1941 حدثًا صالحًا لمحاكاة Geant4. توضح عروض الأحداث المثاليات الكائنات المعاد بناؤها من تدفق الجسيمات (PFOs) لكلا نوعي الزخات، مما يبرز فعالية عملية إعادة البناء.
نتائج
في هذا القسم، تُعرض نتائج توليد زخات $\pi^+$ في الكالوريترات الكهرومغناطيسية والهادونية، بعد إجراء إجراء أخذ عينات شمل معايرة عدد النقاط لكل طبقة. تعزز هذه المعايرة، على الرغم من عدم كونها ضرورية بشكل صارم، دقة نموذج PointCountFM في التقاط توزيع النقاط على طول المحور $y$ مقارنةً بنموذج الانتشار. تم إسقاط زخات سحابة النقاط المولدة على شبكة منتظمة تتطابق مع أحجام خلايا الكالوريترات ILD (5×5 مم² لـ ECal و30×30 مم² لـ HCal)، مع تطبيق قطع طاقة الخلية عند حوالي $10^{-2}$ ميغا فولت لتخفيف الضوضاء الإلكترونية. تشير المقارنات البصرية إلى أن نموذج CaloHadronic يعيد إنتاج المسارات من التفاعلات الهادونية في زخات $\pi^+$ بفعالية، مع تميز خاص في تصوير الهياكل الدقيقة في HCal.
ركز التحليل الإضافي لأداء النموذج بالنسبة لـ Geant4 على الملاحظات الفيزيائية الرئيسية بعد إعادة البناء، بما في ذلك الطاقة والزخم لكائنات تدفق الجسيمات المعاد بناؤها (PFOs). بينما تم التعرف على الغالبية العظمى من PFOs بدقة على أنها $\pi^+$، تم تصنيف 57% ملحوظ بشكل خاطئ كجسيمات هادونية مشحونة أخرى، مثل $K^+$ والبروتونات، مع نسبة صغيرة تم التعرف عليها بشكل خاطئ كإلكترونات وميونات. على الرغم من هذه التصنيفات الخاطئة، أظهر CaloHadronic قدرات نمذجة قوية عبر مختلف الملاحظات، مما يعكس بنجاح أوجه القصور في إعادة البناء التي لوحظت في محاكاة Geant4. كما أبرز التحليل تعقيد الزخات الهادونية، مما يمكن أن يؤدي إلى إعادة بناء عدة PFOs من حدث واحد، مع إظهار PFOs الرائدة نتائج نمذجة مثيرة للإعجاب بشكل مشابه.
مناقشة
تركز قسم المناقشة من ورقة البحث على تصميم وأداء جهاز الكشف الدولي الكبير (ILD) لمصانع هيغز المستقبل للإلكترونات والبوزيترونات، لا سيما في سياق المصادم الخطي الدولي (ILC). يهدف ILD إلى دقة عالية في كشف الجسيمات، مستخدمًا تقنيات متقدمة مثل الكالوريترات عالية الحبيبية وخوارزمية تدفق الجسيمات (PFA) لإعادة بناء زخم الجسيمات النهائية بدقة. يتميز الكالوريتر الكهرومغناطيسي (ECal) لـ ILD بتصميم مدمج مع ألواح ممتصة من التنغستن، بينما يتكون الكالوريتر الهادوني (HCal) من طبقات فولاذية متداخلة مع بلاطات كاشفة. يتم محاكاة هندسة الكاشف باستخدام إطار عمل DD4hep، الذي يتكامل مع Geant4 لمحاكاة الأحداث.
شمل توليد البيانات للدراسة محاكاة تفاعلات جسيمات $\pi^+$ الفردية مع ECal، مع طاقات تتراوح من 10 إلى 90 GeV. شمل معالجة البيانات إنشاء سحب نقاط عالية الحبيبية من مخرجات Geant4، تلتها تقنيات تطبيع لضمان تدريب مستقر للنموذج. يستخدم النموذج المقترح، CaloHadronic، تدفقًا طبيعيًا مستمرًا ونماذج انتشار EDM لمحاكاة الزخات الهادونية، ملتقطًا التفاعلات المعقدة داخل هيكل الزخة. تتضمن الهندسة آليات انتباه لنمذجة أفضل للعلاقات بين النقاط في الزخة، مع معالجة الخصائص الفريدة للتفاعلات الهادونية مقارنةً بالزخات الكهرومغناطيسية. بشكل عام، يُظهر النموذج توافقًا قويًا مع محاكاة Geant4 من حيث توزيعات الطاقة وملفات الزخات، على الرغم من ملاحظة اختلافات طفيفة في أنماط إيداع الطاقة المعتمدة على الطبقة.
DOI: https://doi.org/10.1088/1748-0221/21/01/p01042
Publication Date: 2026-01-01
Author(s): Thorsten Buss et al.
Primary Topic: Particle physics theoretical and experimental studies
Overview
The research presents advancements in simulating particle showers in highly-granular calorimeters using machine learning, specifically through a transformer-based generative model. This model enhances previous architectures designed for electromagnetic showers by incorporating an attention mechanism, enabling the simultaneous generation of complex hadronic showers across both electromagnetic (ECal) and hadronic (HCal) calorimeters. This approach marks a significant milestone as it is the first instance of machine learning being utilized to holistically generate showers in such systems, with the code made publicly available for further research.
In the conclusion, the authors emphasize the necessity for generative models to effectively manage the complexities of realistic calorimeters to transition from proof-of-concept to practical applications. The study demonstrates that the point-cloud based generative model can accurately simulate both ECal and HCal components, capturing individual shower properties and their correlations. Although there is room for improvement in the fidelity of generated outputs, particularly in the detailed track-like structures in HCal, the results show comparable or slightly superior quality to traditional reconstruction algorithms. The proposed strategy of sequentially conditioning multiple generative models may also have broader applications in complex simulation tasks beyond calorimetry.
Introduction
The introduction outlines the necessity of developing generative surrogates for event generation and simulation tasks in high-energy physics, particularly for the high-luminosity Large Hadron Collider (HL-LHC) and future collider studies. As event rates increase due to higher luminosity, the computational demands of high-precision Monte Carlo (MC) simulations are expected to exceed available resources. Generative models, including generative adversarial networks (GANs), variational autoencoders (VAEs), and diffusion models, present a viable solution to alleviate this computational burden. However, most existing research has primarily focused on simulating electromagnetic showers, with limited attempts to model the more complex hadronic showers.
This work introduces the CaloHadronic model, a novel generative machine learning framework designed to simulate hadronic showers across both electromagnetic (ECal) and hadronic (HCal) calorimeters. The model employs a continuous normalizing flow (CNF) to determine the number of points in each layer and utilizes separate EDM-diffusion models for each calorimeter to ensure realistic shower generation that respects the distinct spatial resolutions and materials of the detectors. By conditioning the HCal generation on ECal data, the model effectively captures the transition between the two calorimeters. The introduction sets the stage for a comprehensive exploration of the model’s architecture and performance in subsequent sections, ultimately contributing to the simulation capabilities for the planned International Large Detector at the International Linear Collider.
Methods
In this section, the authors describe the methodology employed to integrate the model output with the ILD’s standard reconstruction suite for analyzing particle showers. Utilizing the DDML library, they simulate the interaction of a 50 GeV $\pi^+$ meson, which is emitted from a particle gun located at coordinates (-5, 0, -15) mm in the global ILD coordinate system. The pion is directed to strike the calorimeter face perpendicularly, accounting for the curvature of its trajectory. Notably, the pion’s energy is recorded at the calorimeter’s face to align with the training conditions, while ensuring that a track is present for the PandoraPFA algorithm to effectively reconstruct the $\pi^+$.
The authors generated a total of 2000 events for both Geant4 and the CaloHadronic model, with subsequent quality cuts applied to the reconstructed tracks. This process resulted in 1929 valid events for the CaloHadronic model and 1941 valid events for the Geant4 simulation. Example event displays illustrate the reconstructed Pandora Particle Flow Objects (PFOs) for both types of showers, highlighting the effectiveness of the reconstruction process.
Results
In this section, the results of generating $\pi^+$ showers in electromagnetic and hadronic calorimeters are presented, following a sampling procedure that included a calibration of the number of points per layer. This calibration, while not strictly necessary, enhances the accuracy of the PointCountFM model in capturing the distribution of points along the $y$-axis compared to the diffusion model. The generated point cloud showers were projected onto a regular grid matching the cell sizes of the ILD calorimeters (5×5 mm² for ECal and 30×30 mm² for HCal), with a cell energy cut at approximately $10^{-2}$ MeV applied to mitigate electronic noise. Visual comparisons indicate that the CaloHadronic model effectively reproduces the tracks from hadronic interactions in $\pi^+$ showers, particularly excelling in depicting fine-grained structures in the HCal.
Further analysis of the model’s performance relative to Geant4 focused on key physics observables post-reconstruction, including the energy and momentum of the reconstructed particle flow objects (PFOs). While the majority of PFOs were accurately identified as $\pi^+$, a notable 57% were misclassified as other charged hadrons, such as $K^+$ and protons, with a minor fraction misidentified as electrons and muons. Despite these misclassifications, CaloHadronic demonstrated strong modeling capabilities across various observables, successfully mirroring the reconstruction deficiencies observed in Geant4 simulations. The analysis also highlighted the complexity of hadronic showers, which can lead to multiple PFOs being reconstructed from a single event, with the leading PFOs showing similarly impressive modeling results.
Discussion
The discussion section of the research paper focuses on the design and performance of the International Large Detector (ILD) for future electron-positron Higgs factories, particularly in the context of the International Linear Collider (ILC). The ILD aims for high precision in particle detection, utilizing advanced technologies such as highly granular calorimeters and a Particle Flow Algorithm (PFA) to accurately reconstruct the momenta of final-state particles. The ILD’s electromagnetic calorimeter (ECal) features a compact design with tungsten absorber plates, while the hadronic calorimeter (HCal) consists of steel layers interleaved with scintillator tiles. The detector’s geometry is simulated using the DD4hep framework, which integrates with Geant4 for event simulation.
Data generation for the study involved simulating single $\pi^+$ particle interactions with the ECal, with energies ranging from 10 to 90 GeV. The preprocessing of data included creating high-granularity point clouds from Geant4 outputs, followed by normalization techniques to ensure stable model training. The proposed model, CaloHadronic, employs a continuous normalizing flow and EDM diffusion models to simulate hadronic showers, capturing complex interactions within the shower structure. The architecture incorporates attention mechanisms to better model the relationships between points in the shower, addressing the unique characteristics of hadronic interactions compared to electromagnetic showers. Overall, the model demonstrates strong agreement with Geant4 simulations in terms of energy distributions and shower profiles, although minor discrepancies in layer-dependent energy deposition patterns are noted.
