DOI: https://doi.org/10.1038/s41598-025-10537-6
PMID: https://pubmed.ncbi.nlm.nih.gov/40659733
تاريخ النشر: 2025-07-14
المؤلف: Zhuo Zeng وآخرون
الموضوع الرئيسي: الزراعة الذكية والذكاء الاصطناعي
نظرة عامة
تقدم البحث نموذج AttCM-Alex، وهو إطار عمل جديد للتعلم العميق يهدف إلى تحسين الكشف وتصنيف أمراض النباتات في ظل ظروف بيئية صعبة، والتي تعتبر حاسمة لضمان الأمن الغذائي العالمي. يدمج النموذج العمليات التلافيفية مع آليات الانتباه الذاتي للتخفيف بفعالية من آثار تغير شدة الضوء وضوضاء الصورة، والتي تعتبر عقبات شائعة في البيئات الزراعية الواقعية. لمحاكاة السيناريوهات العملية، استخدمت الدراسة الاستيفاء الثنائي لتغيير حجم الصور وقدمت ضوضاء الملح والفلفل، مع تقييم متانة النموذج ضد التغيرات في مستويات السطوع.
تشير النتائج التجريبية إلى أن AttCM-Alex يتفوق بشكل كبير على النماذج التقليدية، حيث حقق دقة كشف قصوى تبلغ 0.97 مع زيادة بنسبة 30% في السطوع وحافظ على دقة تبلغ 0.93 مع انخفاض بنسبة 30% في السطوع. ومن الجدير بالذكر أن النموذج أظهر مقاومة ضد الضوضاء، حيث حقق دقة كشف تبلغ 0.97 حتى مع إضافة 30% من ضوضاء الملح والفلفل إلى الصور. تؤكد هذه النتائج على إمكانيات النموذج كأداة موثوقة لتعزيز أنظمة الكشف عن الأمراض في الزراعة، مما يدعم تحسين إدارة المحاصيل ويساهم في ممارسات الزراعة المستدامة. ستركز الأبحاث المستقبلية على تحسين النموذج لتقليل حجم المعلمات وكفاءة الحوسبة، مما يجعله مناسبًا للنشر في البيئات ذات الموارد المحدودة.
مقدمة
في مجال التعرف على أمراض النباتات، تأثرت التقدمات في رؤية الكمبيوتر بشكل كبير بـ Transformers البصرية، خاصة بسبب آليات الانتباه الفعالة الخاصة بها. تركز الأبحاث الحالية في هذا المجال بشكل أساسي على نهجين: تطوير نماذج Transformer النقية بدون طبقات تلافيفية ودمج آليات الانتباه في الشبكات العصبية التلافيفية (CNNs). تتبنى هذه الدراسة النهج الأخير، الذي أظهر نتائج واعدة في تعزيز دقة الكشف. على سبيل المثال، قدم Albahli وآخرون EANet، محققين دقة كشف ملحوظة تبلغ 99.89% على مجموعة بيانات مخصصة، بينما حقق Alirezazadeh وآخرون دقة تبلغ 86.89% من خلال دمج الانتباه القنوي في EfficientNet.
تتمثل التحديات الرئيسية في الكشف عن أمراض النباتات في تباين سطوع الصورة، المتأثر بعوامل مثل الوقت من اليوم، وظروف الطقس، وشدة الضوء، والتي يمكن أن تؤثر سلبًا على أداء الكشف. لمعالجة هذه المشكلة، تقترح الدراسة الحالية بنية جديدة، AttCM-Alex، مصممة خصيصًا للكشف عن أمراض النباتات في ظل ظروف سطوع متغيرة، مما يهدف إلى تحسين الدقة والموثوقية في البيئات الزراعية الواقعية.
طرق
تعزز المنهجية المقترحة في هذا البحث الكشف عن أمراض النباتات من خلال تقديم نموذج قائم على التعلم العميق، AttCM-Alex، الذي يدمج الشبكات العصبية التلافيفية (CNNs) و Transformers البصرية (ViTs) من خلال وحدة AttCM مبتكرة. يعالج هذا النموذج قيود الطرق التقليدية من خلال استخدام آليات الانتباه الذاتي التي تسمح بالتقاط المعلومات العالمية والأنماط المعقدة داخل الصور بشكل فعال. على عكس CNNs، التي لديها مجال استقبال محدود، يمكن لـ ViTs وزن مناطق الصورة المختلفة بناءً على أهميتها، مما يحسن قدرة النموذج على فهم العلاقات المكانية. بالإضافة إلى ذلك، تضبط آلية الانتباه القنوي أهمية كل قناة خريطة ميزات، مما يعزز تركيز النموذج على الجوانب الأكثر معلوماتية لتصنيف الأمراض. تظهر النتائج التجريبية أن AttCM-Alex يحقق دقة متفوقة في تحديد وتصنيف أمراض النباتات، متفوقًا على النماذج الحالية.
استخدمت الدراسة مجموعة بيانات مستمدة من مجموعة أوراق نبات MalayaKew و employed الاستيفاء الثنائي لتوحيد أبعاد الصورة إلى 224 × 224 × 3. تم إجراء الإعداد التجريبي على نظام Ubuntu 20.04 مع معالج Intel Core i7-10875H و بطاقة رسومات NVIDIA GeForce RTX 3050 Ti، مما يسهل مهام التعلم العميق من خلال إطار عمل PyTorch. تم تقييم أداء النموذج بدقة، مما كشف عن متانته ضد التغيرات في سطوع الصورة وفعاليته في البيئات المسيطر عليها، على الرغم من أنه أظهر الحاجة إلى مزيد من التحقق في ظروف الحقل الديناميكية. الكود الخاص بالنموذج متاح للجمهور، مما يعزز الشفافية والمزيد من الأبحاث في هذا المجال.
نقاش
في قسم النقاش، يبرز البحث قيود طرق الكشف التقليدية عن الآفات والأمراض في الزراعة، والتي غالبًا ما تكون كثيفة العمالة، مكلفة، وغير فعالة للمراقبة المستمرة. تواجه الطرق التقليدية للتعلم الآلي صعوبات في التطبيقات الواقعية بسبب الطلبات الحوسبية العالية ونقص القدرة على التكيف مع الظروف البيئية المتغيرة. تواجه نماذج التعلم العميق، مثل Convolutional Swin Transformer، أيضًا تحديات، بما في ذلك متطلبات التخزين الكبيرة وتدهور الأداء في ظل ظروف متنوعة. يؤكد المؤلفون على الحاجة إلى نماذج قوية وقابلة للتكيف وفعالة من حيث الحوسبة يمكن أن تحافظ على أداء عالٍ في البيئات الزراعية غير المتوقعة.
لمعالجة هذه التحديات، تقدم الدراسة نموذج AttCM-Alex، الذي يدمج مكونات متقدمة لتعزيز استخراج الميزات ودقة التصنيف. يجمع هذا النموذج الهجين بين نقاط القوة في Transformers البصرية (ViTs) والشبكات العصبية التلافيفية (CNNs) لتحسين كفاءة الكشف في البيئات المعقدة. أظهر نموذج AttCM-Alex دقة متفوقة، حيث حقق 0.95 على مجموعة بيانات الخيار و 0.97 على مجموعة بيانات الموز، حتى في ظل مستويات سطوع وضوضاء متغيرة. يبرز البحث أهمية تطوير نماذج يمكن أن تعمل بفعالية على الأجهزة المحمولة والأطراف، مما يضمن القابلية للتوسع والتطبيق العملي في البيئات الزراعية الواقعية. تم توضيح تنظيم الدراسة، مع تفاصيل حول مراجعة الأدبيات، المنهجية المقترحة، الهياكل الهجينة، والنتائج التجريبية، والتي تهدف مجتمعة إلى تعزيز الكشف عن أمراض النباتات والمساهمة في ممارسات الزراعة المستدامة.
DOI: https://doi.org/10.1038/s41598-025-10537-6
PMID: https://pubmed.ncbi.nlm.nih.gov/40659733
Publication Date: 2025-07-14
Author(s): Zhuo Zeng et al.
Primary Topic: Smart Agriculture and AI
Overview
The research presents the AttCM-Alex model, a novel deep-learning framework aimed at improving the detection and classification of plant diseases under challenging environmental conditions, which are critical for ensuring global food security. The model integrates convolutional operations with self-attention mechanisms to effectively mitigate the effects of varying light intensity and image noise, which are common obstacles in real-world agricultural settings. To simulate practical scenarios, the study utilized bilinear interpolation for image resizing and introduced Salt-and-Pepper noise, assessing the model’s robustness against variations in brightness levels.
Experimental results indicate that AttCM-Alex significantly outperforms traditional models, achieving a peak detection accuracy of 0.97 with a 30% increase in brightness and maintaining an accuracy of 0.93 with a 30% decrease in brightness. Notably, the model demonstrated resilience against noise, achieving a detection accuracy of 0.97 even with 30% Salt-and-Pepper noise added to the images. These findings underscore the model’s potential as a reliable tool for enhancing disease detection systems in agriculture, thereby supporting improved crop management and contributing to sustainable agricultural practices. Future research will focus on optimizing the model for reduced parameter size and computational efficiency, making it suitable for deployment in resource-constrained environments.
Introduction
In the realm of plant disease recognition, advancements in computer vision have been significantly influenced by Visual Transformers, particularly due to their effective attention mechanisms. Current research in this field is primarily focused on two approaches: the development of pure Transformer models without convolutional layers and the integration of attention mechanisms into Convolutional Neural Networks (CNNs). This study adopts the latter approach, which has shown promising results in enhancing detection accuracy. For instance, Albahli et al. introduced EANet, achieving a remarkable detection accuracy of 99.89% on a custom dataset, while Alirezazadeh et al. achieved 86.89% accuracy by incorporating channel attention into EfficientNet.
A critical challenge in plant disease detection is the variability in image brightness, influenced by factors such as time of day, weather conditions, and light intensity, which can adversely affect detection performance. To address this issue, the present study proposes a novel architecture, AttCM-Alex, designed specifically for detecting plant diseases under varying brightness conditions, thereby aiming to improve accuracy and reliability in real-world agricultural settings.
Methods
The proposed methodology in this research enhances plant disease detection by introducing a deep learning-based model, AttCM-Alex, which integrates convolutional neural networks (CNNs) and vision transformers (ViTs) through an innovative AttCM module. This model addresses the limitations of traditional methods by employing self-attention mechanisms that allow for the effective capture of global information and complex patterns within images. Unlike CNNs, which have a restricted receptive field, ViTs can weigh different image regions based on their relevance, thus improving the model’s ability to understand spatial relationships. Additionally, the channel attention mechanism fine-tunes the importance of each feature map channel, enhancing the model’s focus on the most informative aspects for disease classification. The experimental results demonstrate that AttCM-Alex achieves superior accuracy in identifying and classifying plant diseases, outperforming existing models.
The study utilized a dataset derived from the MalayaKew plant leaf subset and employed bilinear interpolation to standardize image dimensions to 224 × 224 × 3. The experimental setup was conducted on an Ubuntu 20.04 system with an Intel Core i7-10875H CPU and an NVIDIA GeForce RTX 3050 Ti GPU, facilitating deep learning tasks through the PyTorch framework. The model’s performance was rigorously evaluated, revealing its robustness against variations in image brightness and its effectiveness in controlled environments, although it highlighted the need for further validation in dynamic field conditions. The model’s code is publicly accessible, promoting transparency and further research in the field.
Discussion
In the discussion section, the paper highlights the limitations of conventional pest and disease detection methods in agriculture, which are often labor-intensive, costly, and inefficient for continuous monitoring. Traditional machine learning approaches struggle with real-world applications due to high computational demands and lack of adaptability to varying environmental conditions. Deep learning models, such as the Convolutional Swin Transformer, also face challenges, including significant storage requirements and performance degradation under diverse conditions. The authors emphasize the need for robust, adaptive, and computationally efficient models that can maintain high performance in unpredictable agricultural environments.
To address these challenges, the study introduces the AttCM-Alex model, which integrates advanced components to enhance feature extraction and classification accuracy. This hybrid model combines the strengths of Vision Transformers (ViTs) and Convolutional Neural Networks (CNNs) to improve detection efficiency in complex environments. The AttCM-Alex model demonstrated superior accuracy, achieving 0.95 on the cucumber dataset and 0.97 on the banana dataset, even under varying brightness levels and noise conditions. The research underscores the importance of developing models that can effectively operate on mobile and edge devices, ensuring scalability and practical application in real-world agricultural settings. The organization of the study is outlined, detailing sections on literature review, proposed methodology, hybrid architectures, and experimental results, which collectively aim to enhance plant disease detection and contribute to sustainable agricultural practices.
