DOI: https://doi.org/10.1038/s41586-024-07590-y
PMID: https://pubmed.ncbi.nlm.nih.gov/39085539
تاريخ النشر: 2024-07-31
المؤلف: Bowei Dong وآخرون
الموضوع الرئيسي: الشبكات العصبية وحوسبة الخزانات
طرق
في هذا القسم، يوضح المؤلفون طرق التصنيع لمصفوفة مقياس التداخل ماخ-زيندر (MZI)، ومصفوفة ذاكرة ضوئية، ونواة موحد امتصاص كهربائي ضوئي (EAM). تم بناء مصفوفة MZI على رقاقة سيليكون على عازل، باستخدام سلسلة من العمليات بما في ذلك الطباعة الإلكترونية (EBL) للنمذجة، وحفر الأيونات التفاعلية لتشكيل الموجات، وترسيب ثاني أكسيد السيليكون كطبقة تغليف علوية. شملت عملية تصنيع سخانات NiCr وألواح الذهب تقنيات الرش والتبخر الإلكتروني، تلتها عملية رفع.
بالنسبة لمصفوفة ذاكرة ضوئية، استخدم المؤلفون خدمة رقاقة متعددة المشاريع لتصنيع دائرة ضوئية سيليكونية، والتي تضمنت ترسيب طبقة من Ge2Sb2Te5 (GST) وأكسيد القصدير الإنديوم (ITO). تضمنت هذه العملية EBL للنمذجة ورش المغناطيس لترسيب المواد، تلتها عملية رفع الأسيتون لإزالة المواد الزائدة. تم تصنيع محولات الطور الحراري الضوئي بطريقة مشابهة لمصفوفة MZI، وخضعت الشريحة بالكامل للتسخين لتبلور GST. أخيرًا، تم تصنيع نواة EAM الضوئية باستخدام خدمة مصنع مختلفة، حيث تم دمج دوائر الموجات السلبية وEAMs وكاشفات الضوء في هيكل موحد. تم توفير الصور الضوئية للأجهزة المصنعة في الأشكال التكميلية.
النتائج
في هذا القسم، يصف المؤلفون طريقة لرسم مخرجات النقل غير السلبية من نظام ضوئي إلى نتائج الالتفاف التي تقع ضمن نطاق [-1، 1]. يتم تقييد إشارات المشي المدخلة وبيانات الصورة إلى قيم غير سلبية ($x \in [0، 1]$)، بينما تحتوي نوى الالتفاف على قيم سلبية ($w \in [-1، 1]$). تتضمن عملية الرسم عدة خطوات، بما في ذلك تعيين المتجه المدخل ونواة القيم المستهدفة، وقياس المخرجات، وإجراء حسابات محددة لاشتقاق النتائج النهائية.
تتكون الإجراءات من خطوات متعددة (موسومة (د) إلى (ح))، حيث يقوم المؤلفون بحساب المخرجات المقاسة بناءً على تكوينات مختلفة من المتجه المدخل والنواة. على سبيل المثال، في الخطوة (د)، يتم حساب المخرج مع تعيين كل من المدخل والنواة إلى قيمهما المستهدفة، بينما في الخطوة (هـ)، يتم تعيين كلاهما إلى الصفر لتأسيس مخرج أساسي. تتضمن الخطوات اللاحقة تغيير قيم المدخل والنواة للحصول على مجموعة شاملة من القياسات. أخيرًا، تتم معالجة النتائج من هذه القياسات وتطبيعها لضمان ملاءمتها ضمن النطاق المطلوب. يشير المؤلفون إلى أنه بينما تتطلب هذه الطريقة في الرسم ضعف المتطلبات الحسابية، يمكن تحسينها من خلال تنفيذات الأجهزة، مثل مخطط الكشف الضوئي المتوازن.
المناقشة
تناقش الدراسة مزايا استخدام الضوء شبه المتماسك في النوى الضوئية لتعزيز التوازي في مهام الحوسبة. على عكس مصادر الضوء المتماسك التقليدية، التي تتطلب تحكمًا دقيقًا ويمكن أن تؤدي إلى تقلبات كبيرة في الشدة بسبب اختلافات الطور، يسمح الضوء شبه المتماسك باستقرار الشدة عبر قنوات الإدخال المتعددة. يمكّن هذا الاستقرار من استخدام نفس الطول الموجي عبر جميع القنوات، مما يزيد بشكل كبير من توازي العمليات، حيث يمكن أن يخدم نطاق ضوئي واحد عدة متجهات إدخال في وقت واحد. تظهر الدراسة أن هذه الطريقة يمكن أن تحقق تحسينات N-fold في التوازي، مما يجعلها أكثر قابلية للتوسع من الأنظمة المتماسكة، التي تتطلب نطاقات ضوئية متعددة لعمليات مماثلة.
تسلط النتائج الضوء أيضًا على المساومات المرتبطة بالضوء شبه المتماسك، خاصة فيما يتعلق بنسبة الإشارة إلى الضوضاء (SNR). بينما قد تقدم الأنظمة المتماسكة SNR أعلى في التطبيقات ذات الأبعاد المنخفضة، تحافظ الأنظمة شبه المتماسكة على SNRs قابلة للمقارنة على نطاقات أكبر، خاصة عند استخدام مصادر الضوء العريض مثل الصمامات الثنائية الفائقة اللمعان (SLEDs). تتضمن الدراسة تطبيقات عملية، مثل استخدام نواة ذاكرة ضوئية لتحليل إشارات المشي من مرضى باركنسون، محققة دقة تصنيف قابلة للمقارنة مع تلك التي تم الحصول عليها من الأنظمة المتماسكة ولكن مع عدد أقل من قنوات الطول الموجي. بالإضافة إلى ذلك، يظهر المعالجة السريعة للالتفاف على مجموعات بيانات مثل MNIST مرونة وكفاءة الأنظمة شبه المتماسكة في مهام الذكاء الاصطناعي، محققة سرعات معالجة كبيرة وتحسينات في الدقة من خلال تقنيات مثل المتوسط. بشكل عام، تتحدى الدراسة التفضيل التقليدي للضوء المتماسك في الحوسبة الضوئية، مقترحة أن تقليل التماسك يمكن أن يؤدي إلى تحسين الأداء وقابلية التوسع.
DOI: https://doi.org/10.1038/s41586-024-07590-y
PMID: https://pubmed.ncbi.nlm.nih.gov/39085539
Publication Date: 2024-07-31
Author(s): Bowei Dong et al.
Primary Topic: Neural Networks and Reservoir Computing
Methods
In this section, the authors detail the fabrication methods for a Mach-Zehnder Interferometer (MZI) array, a photonic memory crossbar array, and a photonic Electro-Absorption Modulator (EAM) tensor core. The MZI array was constructed on a silicon-on-insulator wafer, utilizing a series of processes including e-beam lithography (EBL) for patterning, reactive ion etching for waveguide formation, and the deposition of silicon dioxide as an upper cladding layer. The fabrication of NiCr heaters and gold pads involved sputtering and e-beam evaporation techniques, respectively, followed by a lift-off process.
For the photonic memory crossbar array, the authors employed a multi-project wafer service to fabricate a silicon photonic circuit, which included the deposition of a Ge2Sb2Te5 (GST) and indium tin oxide (ITO) stack. This process involved EBL for patterning and magnetron sputtering for material deposition, followed by an acetone lift-off to remove excess materials. The thermo-optic phase shifters were fabricated similarly to the MZI array, and the entire chip underwent annealing to crystallize the GST. Lastly, the photonic EAM tensor core was fabricated using a different foundry service, integrating passive waveguide circuits, EAMs, and photodetectors into a monolithic structure. The optical images of the fabricated devices are provided in the supplementary figures.
Results
In this section, the authors describe a method for mapping non-negative transmission outputs from a photonic system to convolution results that fall within the range of [-1, 1]. The input gait signals and image data are constrained to non-negative values ($x \in [0, 1]$), while the convolution kernels contain negative values ($w \in [-1, 1]$). The mapping process involves several steps, including setting the input vector and kernel to target values, measuring outputs, and performing specific calculations to derive the final results.
The procedure consists of multiple steps (labeled (d) to (h)), where the authors calculate the measured outputs based on different configurations of the input vector and kernel. For instance, in step (d), the output is computed with both the input and kernel set to their target values, while in step (e), both are set to zero to establish a baseline output. Subsequent steps involve varying the input and kernel values to obtain a comprehensive set of measurements. Finally, the results from these measurements are processed and normalized to ensure they fit within the desired range. The authors note that while this mapping approach effectively doubles the computational requirements, it can potentially be optimized through hardware implementations, such as a balanced photodetection scheme.
Discussion
The research discusses the advantages of using partially coherent light in photonic tensor cores for enhanced parallelism in computing tasks. Unlike traditional coherent light sources, which require precise control and can lead to significant intensity fluctuations due to phase differences, partially coherent light allows for stable intensity across multiple input channels. This stability enables the same wavelength to be utilized across all channels, significantly increasing the parallelism of operations, as one optical band can serve multiple input vectors simultaneously. The study demonstrates that this approach can achieve N-fold enhancements in parallelism, making it more scalable than coherent systems, which require multiple optical bands for similar operations.
The findings also highlight the trade-offs associated with partially coherent light, particularly concerning signal-to-noise ratio (SNR). While coherent systems may offer higher SNR in low-dimensional applications, partially coherent systems maintain comparable SNRs at larger scales, particularly when using broadband light sources like superluminescent diodes (SLEDs). The research includes practical applications, such as using a photonic memory tensor core to analyze gait signals from Parkinson’s disease patients, achieving classification accuracies comparable to those obtained with coherent systems but with fewer wavelength channels. Additionally, high-speed convolutional processing on datasets like MNIST demonstrates the versatility and efficiency of partially coherent systems in AI tasks, achieving significant processing speeds and accuracy improvements through techniques like averaging. Overall, the study challenges the conventional preference for coherent light in photonic computing, suggesting that reduced coherence can lead to enhanced performance and scalability.
