DOI: https://doi.org/10.1038/s41598-025-87800-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40082482
تاريخ النشر: 2025-03-13
المؤلف: B. Naresh kumar وآخرون
الموضوع الرئيسي: الزراعة الذكية والذكاء الاصطناعي
نظرة عامة
في هذه الدراسة، تم تطوير مصنف جديد يعتمد على الرؤية المدمجة (FVBC) لتصنيف أمراض أوراق الأرز (RLD)، مستفيدًا من قدرات استخراج الميزات لهندسة VGG19 جنبًا إلى جنب مع كفاءة التصنيف لـ LightGBM. أظهر النموذج أداءً ملحوظًا، محققًا دقة تصل إلى 97.78% على مجموعة التدريب، و97.5% على مجموعة التحقق، و97.6% على مجموعة الاختبار. وقد نجح في تصنيف ست فئات متميزة من أوراق الأرز، بما في ذلك العفن البكتيري، والبقع البنية، والانفجار الورقي، والتجعيد الورقي، والبقع البنية الضيقة، والأوراق الصحية. تم التقاط ميزات رئيسية مثل أنماط القوام، وتغيرات اللون، والعيوب الهيكلية بشكل فعال بواسطة VGG19، بينما قدمت LightGBM تصنيفًا دقيقًا، حتى بين الأمراض المتشابهة بصريًا. كما أن استخدام تقنيات زيادة البيانات عزز من قدرات تعميم النموذج، مما يعالج قضايا عدم توازن الفئات.
أكدت التحليلات المقارنة مع النماذج الرائدة مثل ResNet50 وDenseNet121 وMobileNetV2 على تفوق نموذج FVBC من حيث الدقة والدقة ودرجة F1. تؤكد النتائج على الدور الحاسم للكشف المبكر عن الأمراض في تقليل خسائر المحاصيل وتعزيز الممارسات الزراعية المستدامة. تشمل اتجاهات البحث المستقبلية توسيع مجموعة البيانات لتشمل مجموعة واسعة من الظروف البيئية وأمراض الأرز، ودمج نموذج FVBC مع أنظمة المراقبة في الوقت الحقيقي مثل الطائرات بدون طيار أو المستشعرات المدعومة بالإنترنت للأشياء لمراقبة الأمراض بشكل آلي، وتحسين النموذج للنشر في البيئات ذات الموارد المحدودة. بالإضافة إلى ذلك، قد يؤدي استكشاف طرق التجميع أو الهياكل الهجينة التي تتضمن التصوير متعدد الطيف أو البيانات الزمنية إلى تعزيز دقة الكشف وتقليل الإيجابيات والسلبيات الكاذبة.
مقدمة
المساهمة الرئيسية في هذا البحث هي تقديم نهج جديد للكشف عن أمراض أوراق الأرز (RLD)، يسمى مصنف Fusion VGG19-LightGBM (FVBC). يجمع هذا النموذج بشكل متكامل بين شبكة VGG19 العصبية التلافيفية (CNN) لاستخراج الميزات مع خوارزمية تعزيز التدرج LightGBM للتصنيف. من خلال الاستفادة من نقاط القوة في التعلم العميق (DL) وتقنيات تعزيز التدرج، يظهر FVBC دقة استثنائية في تحديد أنواع مختلفة من RLD، مما يوفر طريقة غير جراحية وفعالة للكشف المبكر عن الأمراض في محاصيل الأرز.
يمثل FVBC تقدمًا كبيرًا في تحليل الصور الزراعية، حيث يقدم حلاً عمليًا وقابلًا للتوسع للتطبيقات الواقعية في مراقبة الأمراض. لا يضمن النموذج فقط الكشف الموثوق والسريع عن RLD، وهو أمر حاسم للتدخل في الوقت المناسب وحماية المحاصيل، ولكنه يحافظ أيضًا على الكفاءة الحاسوبية. تم هيكلة الورقة لتشمل مراجعة للأعمال ذات الصلة في قسم “الأعمال ذات الصلة”، ومنهجية مفصلة وهندسة نموذج FVBC في قسم “المنهجية”، وتحليل النتائج في قسم “النتائج والمناقشات”، وتختتم باتجاهات البحث المستقبلية المحتملة في قسم “الخاتمة والعمل المستقبلي”.
طرق
يحدد قسم المنهجية في هذه الدراسة تصميم بحث تجريبي يهدف إلى تطوير والتحقق من نهج جديد للكشف عن أمراض الأرز (RDD) باستخدام نموذج هجين يعرف باسم FVBC. شملت الأبحاث تجارب منهجية لتقييم فعالية النموذج مقارنة بأحدث الطرق. تم الحصول على مجموعة بيانات شاملة تضم 2,627 صورة، تمثل أنواعًا مختلفة من أمراض أوراق الأرز (بما في ذلك العفن البكتيري، والبقع البنية، والانفجار الورقي، والتجعيد الورقي، والبقع البنية الضيقة) بالإضافة إلى عينات صحية، من Kaggle. تم تنظيم هذه المجموعة بدقة إلى مجموعات تدريب والتحقق لضمان تدريب قوي للنموذج.
يدمج نموذج FVBC مكونين متقدمين: شبكة VGG19 العصبية التلافيفية (CNN) لاستخراج الميزات المعقدة وخوارزمية تعزيز التدرج LightGBM للتصنيف الدقيق. نموذج VGG19، المدرب مسبقًا على مجموعات بيانات صور واسعة، يستخرج بشكل فعال ميزات عالية المستوى ضرورية لتحديد أنماط الأمراض في صور أوراق الأرز. تعزز LightGBM عملية التصنيف بقدراتها السريعة في اتخاذ القرار. بعد التطوير الأولي للنموذج، تم إجراء مرحلة شاملة من ضبط المعلمات والتحقق، مع ضبط المعلمات بشكل منهجي لتحسين الأداء. انتهت عملية التحسين التكرارية بنموذج FVBC قوي، جاهز لإحداث تأثير كبير في مجال RDD من خلال دقته وفعاليته.
نتائج
تظهر نتائج هذه الدراسة التنفيذ الناجح لنموذج FVBC للكشف عن أمراض أوراق الأرز (RDD) باستخدام موارد حاسوبية متقدمة، بما في ذلك معالج Intel® Core™ i7 من الجيل الحادي عشر وبطاقة الرسوميات GeForce RTX 4090. يعزز هذا الإعداد بشكل كبير من كفاءة تدريب النموذج والتعامل مع مجموعات البيانات الزراعية الكبيرة. يعزز استخدام Jupyter Notebook كبيئة تطوير الشفافية والتعاون بين الباحثين، مما يسهل تبادل المعرفة في تكنولوجيا الزراعة. تتكون مجموعة البيانات من 2,627 صورة مصنفة إلى مجموعات تدريب (2,101)، والتحقق (263)، والاختبار (263)، مما يضمن أساسًا قويًا لتدريب النموذج وتقييمه. يدمج نموذج FVBC الشبكات العصبية التلافيفية (CNNs)، وبشكل خاص VGG19، لاستخراج الميزات، وLightGBM للتصنيف، محققًا دقة نهائية في التدريب تبلغ 97.78% ودقة في التحقق تبلغ 97.5%.
كانت تقنيات معالجة البيانات، بما في ذلك تغيير حجم الصور، والتطبيع، وزيادة البيانات، حاسمة في تحسين أداء النموذج. تلتقط بنية النموذج بشكل فعال الأنماط المعقدة في صور أوراق الأرز، مما يعزز قدراته التنبؤية. يكشف تقييم نموذج FVBC مقارنة بمختلف نماذج التعلم الآلي والتعلم العميق عن أدائه المتفوق، مع دقة تصنيف تبلغ 97.78%، متفوقًا على نماذج أخرى مثل Wide Residual Network (96.3%) وResNeXt50 (95.75%). يبرز هذا إمكانيات نموذج FVBC كأداة تحويلية للكشف المبكر عن الأمراض في الزراعة، مما يساهم في تحسين إدارة المحاصيل والأمن الغذائي. تؤكد الطريقة المنهجية لإعداد البيانات، وتدريب النموذج، والتقييم على فعالية دمج تقنيات التعلم العميق وتعزيز التدرج في معالجة التحديات الزراعية.
مناقشة
تسلط المناقشة الضوء على الدور الحاسم للأرز كغذاء أساسي لأكثر من 3.5 مليار شخص والأثر الكبير لأمراض أوراق الأرز (RLDs) على إنتاجية الزراعة، والتي يمكن أن تقلل من قيمة المحاصيل بنسبة 20-40%. تقترح الورقة نهجًا يعتمد على التعلم العميق باستخدام الشبكات العصبية التلافيفية المدربة مسبقًا (CNNs) لتعزيز تشخيص وتصنيف أحد عشر نوعًا من RLDs. تقيم الدراسة هياكل مختلفة، بما في ذلك XceptionNet وResNet 50 وDenseNet، حيث حقق XceptionNet أعلى دقة بنسبة 93.3%. يهدف الأسلوب المقترح إلى تسهيل الكشف السريع والفعال من حيث التكلفة عن الأمراض، مما يحسن من إنتاجية الزراعة ويقلل من الخسائر.
تشدد الأبحاث على ضرورة أنظمة الكشف الآلي عن الأمراض لتخفيف التحديات التي يواجهها المزارعون، خاصة في زراعة الأرز على نطاق واسع. من خلال استخدام تقنيات مثل تقسيم الصور والتعلم الآلي، تقدم الدراسة إطارًا قويًا لتحديد RLDs بدقة عالية، حتى في ظل ظروف معقدة. تعزز دمج استراتيجيات معالجة البيانات وزيادة البيانات من أداء النموذج، محققة دقة متوسطة مثيرة للإعجاب تبلغ 99.67% على مجموعات البيانات العامة. لا تدعم هذه التقدم في تكنولوجيا التشخيص التدخلات في الوقت المناسب في إدارة الأمراض فحسب، بل تساهم أيضًا في ممارسات الزراعة المستدامة، مما يعالج مخاوف الأمن الغذائي في المناطق المعتمدة على الأرز.
القيود
تحدد الدراسة عدة قيود تؤثر على قوة نموذج FVBC المقترح للكشف عن الأمراض في البيئات الزراعية. كانت إحدى التحديات الكبيرة هي تقارب النموذج، خاصة عند ضبط المعلمات لـ LightGBM، مما تطلب تجارب واسعة، مما أدى إلى زيادة وقت المعالجة. أظهر نموذج FVBC إيجابيات وسلبيات كاذبة عرضية، خاصة في التمييز بين الأمراض ذات الأعراض المتشابهة ولكن المظاهر المختلفة، مثل البقع البنية والبقع البنية الضيقة. يبرز هذا ضرورة تحسين عمليات استخراج الميزات والتصنيف.
علاوة على ذلك، فإن قابلية تعميم النموذج مقيدة بعدم قدرته على حساب التغيرات في العوامل البيئية، مثل ظروف الإضاءة، والضوضاء الخلفية، والتغيرات الموسمية، التي يمكن أن تؤثر بشكل كبير على أعراض النباتات. تتفاقم هذه القيود بسبب تأثير مراحل نمو المحاصيل، وأنواع التربة، وتقلبات الطقس على ظهور الأمراض. لمعالجة هذه التحديات، ستركز الأعمال المستقبلية على تعزيز تقارب النموذج، وتوسيع مجموعة البيانات لتشمل ظروف بيئية متنوعة، وتحسين جودة استخراج الميزات، وتطوير نموذج خفيف مناسب للتطبيقات العملية في المناطق الزراعية ذات البيانات المحدودة أو النائية. بالإضافة إلى ذلك، سيتم استخدام استراتيجيات مثل زيادة البيانات وتقنيات المعالجة المتقدمة، بما في ذلك التصوير متعدد الطيف، للتخفيف من آثار التغيرات البيئية على تشخيص الأمراض.
DOI: https://doi.org/10.1038/s41598-025-87800-3
PMID: https://pubmed.ncbi.nlm.nih.gov/40082482
Publication Date: 2025-03-13
Author(s): B. Naresh kumar et al.
Primary Topic: Smart Agriculture and AI
Overview
In this study, a novel Fusion Vision-Based Classifier (FVBC) was developed for the classification of rice leaf diseases (RLD), leveraging the feature extraction capabilities of the VGG19 architecture alongside the classification efficiency of LightGBM. The model demonstrated remarkable performance, achieving accuracies of 97.78% on the training set, 97.5% on the validation set, and 97.6% on the test set. It successfully classified six distinct rice leaf classes, including Bacterial Leaf Blight, Brown Spot, Leaf Blast, Leaf Scald, Narrow Brown Spot, and healthy leaves. Key features such as texture patterns, color variations, and structural irregularities were effectively captured by VGG19, while LightGBM provided precise classification, even among visually similar diseases. The use of data augmentation techniques further enhanced the model’s generalization capabilities, addressing class imbalance issues.
Comparative analyses with leading models like ResNet50, DenseNet121, and MobileNetV2 confirmed the superiority of the FVBC model in terms of accuracy, precision, and F1-score. The findings underscore the critical role of early disease detection in reducing crop losses and promoting sustainable agricultural practices. Future research directions include expanding the dataset to encompass a wider range of environmental conditions and rice diseases, integrating the FVBC model with real-time monitoring systems such as UAVs or IoT-enabled sensors for automated disease surveillance, and optimizing the model for deployment in low-resource settings. Additionally, exploring ensemble methods or hybrid architectures that incorporate multispectral imaging or temporal data may further enhance detection accuracy and mitigate false positives and negatives.
Introduction
The primary contribution of this research is the introduction of a novel approach for rice leaf disease (RLD) detection, termed the Fusion VGG19-LightGBM Classifier (FVBC). This model synergistically combines the VGG19 convolutional neural network (CNN) for feature extraction with the LightGBM gradient boosting algorithm for classification. By leveraging the strengths of deep learning (DL) and gradient boosting techniques, the FVBC demonstrates exceptional accuracy in identifying various RLDs, providing a non-invasive and efficient method for early disease detection in rice crops.
The FVBC represents a significant advancement in agricultural imagery analysis, offering a practical and scalable solution for real-world applications in disease monitoring. The model not only ensures reliable and rapid detection of RLDs, which is crucial for timely intervention and crop protection, but also maintains computational efficiency. The paper is structured to include a review of related works in the “Related works” section, a detailed methodology and architecture of the FVBC in the “Methodology” section, an analysis of results in the “Results and discussions” section, and concludes with potential future research directions in the “Conclusion and future work” section.
Methods
The methodology section of this study outlines an experimental research design aimed at developing and validating a novel approach for rice disease detection (RDD) using a hybrid model known as FVBC. The research involved systematic experimentation to assess the model’s effectiveness against state-of-the-art methods. A comprehensive dataset of 2,627 images, representing various rice leaf diseases (including Bacterial Leaf Blight, Brown Spot, Leaf Blast, Leaf Scald, and Narrow Brown Spot) as well as healthy samples, was sourced from Kaggle. This dataset was meticulously organized into training and validation sets to ensure robust model training.
The FVBC model integrates two advanced components: the VGG19 convolutional neural network (CNN) for intricate feature extraction and the LightGBM gradient boosting algorithm for precise classification. The VGG19 model, pre-trained on extensive image datasets, effectively extracts high-level features essential for identifying disease patterns in rice leaf images. LightGBM enhances the classification process with its rapid decision-making capabilities. Following the model’s initial development, a thorough phase of hyperparameter tuning and validation was conducted, systematically adjusting parameters to optimize performance. The iterative refinement process culminated in a robust FVBC model, poised to make a significant impact in the field of RDD through its precision and efficacy.
Results
The results of this study demonstrate the successful implementation of the FVBC model for rice leaf disease detection (RDD) using advanced computational resources, including an 11th Generation Intel® Core™ i7 processor and a GeForce RTX 4090 graphics card. This setup significantly enhances model training efficiency and the handling of large agricultural datasets. The use of Jupyter Notebook as the development environment promotes transparency and collaboration among researchers, facilitating knowledge sharing in agricultural technology. The dataset comprises 2,627 images categorized into training (2,101), validation (263), and test sets (263), ensuring a robust foundation for model training and evaluation. The FVBC model integrates Convolutional Neural Networks (CNNs), specifically VGG19, for feature extraction, and LightGBM for classification, achieving a final training accuracy of 97.78% and validation accuracy of 97.5%.
Data preprocessing techniques, including image resizing, normalization, and augmentation, were critical in optimizing model performance. The model’s architecture effectively captures complex patterns in rice leaf images, enhancing its predictive capabilities. The evaluation of the FVBC model against various machine learning and deep learning models reveals its superior performance, with a classification accuracy of 97.78%, outperforming other models such as Wide Residual Network (96.3%) and ResNeXt50 (95.75%). This highlights the FVBC model’s potential as a transformative tool for early disease detection in agriculture, contributing to improved crop management and food security. The systematic approach of data preparation, model training, and evaluation underscores the efficacy of combining deep learning and gradient boosting techniques in addressing agricultural challenges.
Discussion
The discussion highlights the critical role of rice as a staple food for over 3.5 billion people and the significant impact of rice leaf diseases (RLDs) on agricultural yield, which can reduce crop value by 20-40%. The paper proposes a deep learning-based approach utilizing pretrained convolutional neural networks (CNNs) to enhance the diagnosis and classification of eleven types of RLDs. The study evaluates various architectures, including XceptionNet, ResNet 50, and DenseNet, with XceptionNet achieving the highest accuracy of 93.3%. The proposed method aims to facilitate rapid and cost-effective disease detection, thereby improving agricultural productivity and minimizing losses.
The research emphasizes the necessity of automated disease detection systems to alleviate the challenges faced by farmers, particularly in large-scale rice cultivation. By employing techniques such as image segmentation and machine learning, the study presents a robust framework for identifying RLDs with high accuracy, even under complex conditions. The incorporation of data preprocessing and augmentation strategies further enhances model performance, achieving an impressive average accuracy of 99.67% on public datasets. This advancement in diagnostic technology not only supports timely interventions in disease management but also contributes to sustainable agricultural practices, addressing food security concerns in rice-dependent regions.
Limitations
The study identifies several limitations that impact the robustness of the proposed FVBC model for disease detection in agricultural settings. A significant challenge was the model’s convergence, particularly when tuning hyperparameters for the LightGBM classifier, which required extensive trial and error, leading to increased processing time. The FVBC model exhibited occasional false positives and negatives, particularly in distinguishing between diseases with similar symptoms but different appearances, such as Brown Spot and Narrow Brown Spot. This highlights the necessity for improvements in feature extraction and classification processes.
Moreover, the model’s generalizability is constrained by its inability to account for variations in environmental factors, such as light conditions, background noise, and seasonal changes, which can significantly affect plant symptoms. These limitations are compounded by the influence of crop growth stages, soil types, and weather fluctuations on disease manifestation. To address these challenges, future work will focus on enhancing model convergence, expanding the dataset to include diverse environmental conditions, improving feature extraction quality, and developing a lightweight model suitable for practical applications in low-data or remote agricultural regions. Additionally, strategies such as data augmentation and advanced preprocessing techniques, including multispectral imaging, will be employed to mitigate the effects of environmental variability on disease diagnosis.
