DOI: https://doi.org/10.3389/fpls.2025.1607582
PMID: https://pubmed.ncbi.nlm.nih.gov/40655551
تاريخ النشر: 2025-06-27
المؤلف: Zhenyun Du وآخرون
الموضوع الرئيسي: الزراعة الذكية والذكاء الاصطناعي
نظرة عامة
تقدم البحث ROSE-MAMBA-YOLO، وهو إطار مبتكر للكشف مصمم بدقة لتحديد الورود في الصور الملتقطة بواسطة الطائرات بدون طيار في البيوت الزجاجية، والذي يواجه تحديات مثل التداخل، وتغير المقياس، وظروف البيئة المعقدة. من خلال دمج نمذجة الحالة المستوحاة من Mamba مع بنية YOLOv11، يعزز النموذج استخراج الميزات، ودمج المقاييس المتعددة، والتمثيل السياقي. يحقق دقة متوسطة (mAP@50) تبلغ 87.5%، مع معدلات دقة واسترجاع تبلغ 90.4% و83.1% على التوالي، متفوقًا على نماذج الكشف عن الأجسام الحالية. التصميم الخفيف للإطار (16.6 ميغابايت) وقدرات المعالجة في الوقت الحقيقي تجعله حلاً قابلاً للتوسع لمراقبة الورود المعتمدة على الطائرات بدون طيار، مما يظهر قوته ضد بيانات الإدخال المتدهورة وقدرته على التكيف عبر مجموعات بيانات متنوعة.
تؤكد الدراسة على فعالية ROSE-MAMBA-YOLO في معالجة التحديات الرئيسية في الكشف، خاصة في البيئات الزراعية المعقدة. تعمل الوحدات المتقدمة للنموذج، مثل C3k2_RFCBAM، MDFPC، وCMFPN، على تحسين قدرته بشكل كبير على الكشف عن الأجسام الصغيرة والحفاظ على الموثوقية تحت الظروف القاسية، بما في ذلك الضباب الغاوسي والضوضاء. تهدف الأبحاث المستقبلية إلى توسيع قدرات النموذج لدعم تمييز مراحل النمو الدقيقة وأنواع الزهور الإضافية، مما يعزز قابليته للتطبيق في الزراعة الدقيقة. بشكل عام، يمثل ROSE-MAMBA-YOLO تقدمًا كبيرًا في دمج تقنيات الكشف الذكية في أنظمة مراقبة المحاصيل في الوقت الحقيقي، مما يمهد الطريق لتحسين الممارسات في زراعة الزهور الدقيقة.
مقدمة
تسلط مقدمة ورقة البحث الضوء على أهمية صناعة زراعة الزهور، وخاصة زراعة الورود، مع التأكيد على الحاجة إلى مراقبة دقيقة لمراحل نمو الورود لتحسين العائد والجودة مع التكيف مع متطلبات السوق. تعتبر طرق المراقبة التقليدية، التي تعتمد على الملاحظة اليدوية والاستطلاعات الميدانية، كثيفة العمالة وعرضة للأخطاء، مما يجعلها أقل ملاءمة للتطبيقات على نطاق واسع. في المقابل، تقدم تقنيات الرؤية الحاسوبية الآلية، وخاصة نماذج الكشف عن الأجسام المعتمدة على التعلم العميق، بديلاً واعدًا. يمكن تصنيف هذه النماذج إلى هياكل ذات مرحلة واحدة، ومرحلتين، ومعتمدة على المحولات، كل منها له مزايا وقيود مميزة فيما يتعلق بالدقة، ومتطلبات الحوسبة، وقابلية التطبيق في الوقت الحقيقي.
تركز الورقة على إطار YOLO (You Only Look Once)، وخاصة YOLOv10 وYOLOv11، اللذان أظهرا تحسينات كبيرة في الكفاءة والدقة للكشف عن الأجسام في الوقت الحقيقي في السياقات الزراعية. على الرغم من هذه التقدمات، لا تزال التحديات قائمة في الكشف عن الأجسام الصغيرة أو المخفية، مثل براعم الورود في مراحلها المبكرة. لمعالجة هذه القضايا، تقترح الدراسة نموذج هجين جديد يدمج Mamba، وهو نموذج حالة معروف بكفاءته في نمذجة الاعتماديات بعيدة المدى، مع YOLOv11. يهدف هذا الدمج إلى تعزيز استخراج الميزات، ودمج المقاييس المتعددة، وفهم السياق، مما يحسن من قوة وكفاءة النموذج المعتمد على الطائرات بدون طيار في مراقبة الورود. تشمل مساهمات هذا البحث تطوير نموذج كشف هجين مُحسن لزراعة الزهور، والتحقق الشامل من أدائه، وقابليته العملية في السيناريوهات الواقعية.
طرق
في هذا القسم، يصف المؤلفون المنهجيات المستخدمة لتعزيز كشف الورود عبر مراحل النمو المختلفة. يقدمون نموذجًا موحدًا يدمج وحدات وهياكل متقدمة، مع تقييم منهجي لأدائه. تشمل المكونات الرئيسية التي تم مناقشتها مجموعات البيانات المستخدمة للتدريب والتحقق، وبنية النموذج، ومنهجيات التدريب المنفذة، ومقاييس التقييم المستخدمة لتقييم فعالية النموذج. تهدف هذه المقاربة الشاملة إلى معالجة التحديات الكامنة في الكشف الدقيق عن الورود في مراحل التطور المختلفة.
نقاش
تسلط قسم النقاش في ورقة البحث الضوء على التقدمات الكبيرة في كشف الزهور والكشف عن الأجسام في الوقت الحقيقي باستخدام تقنيات التعلم العميق. بشكل ملحوظ، طور شانغ وآخرون (2023) نموذجًا خفيف الوزن يعتمد على YOLOv5s لكشف زهور التفاح، محققين دقة تبلغ 88.4% واسترجاع 86.1%، وهو ما يعد مفيدًا بشكل خاص للتطبيقات مثل تقليم الزهور الروبوتية. بالمثل، استخدم رحيم وآخرون (2022) Mask R-CNN لتقدير كمية زهور الكرمة، محققين درجات F1 عالية، مما يظهر فعالية التعلم العميق في المراقبة الزراعية. ومع ذلك، لا تزال التحديات مثل التداخل والهياكل الزهرية المعقدة قائمة، مما يتطلب تحسينات إضافية في دقة الكشف وقابلية التكيف.
في مجال نماذج الحالة (SSMs)، أظهرت الابتكارات الحديثة مثل Mamba ومشتقاتها وعدًا في نمذجة الاعتماديات بعيدة المدى بكفاءة في مهام التسلسل، متفوقة على الهياكل التقليدية مثل المحولات من حيث كفاءة الحوسبة. أدى دمج الوحدات المعتمدة على Mamba في YOLOv11 إلى تطوير Rose-Mamba-YOLO، وهي بنية هجينة مصممة للكشف عن الورود المعتمدة على الطائرات بدون طيار. يتضمن هذا النموذج آليات انتباه مكاني متقدمة وتقنيات دمج ميزات متعددة المقاييس، مما يعزز بشكل كبير قدرته على الكشف عن الأجسام الصغيرة مثل براعم الورود في البيئات المعقدة. تعمل التحسينات المقترحة بشكل جماعي على تحسين دقة الكشف وأداء الحوسبة، مما يضع Rose-Mamba-YOLO كحل قوي للتطبيقات في الوقت الحقيقي في البيئات الزراعية الديناميكية.
DOI: https://doi.org/10.3389/fpls.2025.1607582
PMID: https://pubmed.ncbi.nlm.nih.gov/40655551
Publication Date: 2025-06-27
Author(s): Zhenyun Du et al.
Primary Topic: Smart Agriculture and AI
Overview
The research presents ROSE-MAMBA-YOLO, an innovative detection framework tailored for accurately identifying roses in UAV-captured greenhouse imagery, which faces challenges such as occlusions, scale variability, and complex environmental conditions. By integrating Mamba-inspired state-space modeling with the YOLOv11 architecture, the model enhances feature extraction, multi-scale fusion, and contextual representation. It achieves a mean Average Precision (mAP@50) of 87.5%, with precision and recall rates of 90.4% and 83.1%, respectively, outperforming existing object detection models. The framework’s lightweight design (16.6 MB) and real-time processing capabilities make it a scalable solution for UAV-based rose monitoring, demonstrating its robustness against degraded input data and adaptability across various datasets.
The study emphasizes ROSE-MAMBA-YOLO’s effectiveness in addressing key detection challenges, particularly in complex agricultural environments. The model’s advanced modules, such as C3k2_RFCBAM, MDFPC, and CMFPN, significantly improve its ability to detect small objects and maintain reliability under adverse conditions, including Gaussian blur and noise. Future research aims to extend the model’s capabilities to support finer-grained growth stage distinctions and additional flower species, enhancing its applicability in precision agriculture. Overall, ROSE-MAMBA-YOLO represents a significant advancement in the integration of intelligent detection technologies into real-time crop monitoring systems, paving the way for improved practices in precision floriculture.
Introduction
The introduction of the research paper highlights the significance of the floriculture industry, particularly rose cultivation, emphasizing the need for accurate monitoring of rose growth stages to optimize yield and quality while adapting to market demands. Traditional monitoring methods, reliant on manual observation and field surveys, are labor-intensive and prone to errors, making them less suitable for large-scale applications. In contrast, automated computer vision techniques, particularly deep learning-based object detection models, offer a promising alternative. These models can be categorized into single-stage, two-stage, and Transformer-based architectures, each with distinct advantages and limitations regarding accuracy, computational demands, and real-time applicability.
The paper focuses on the YOLO (You Only Look Once) framework, particularly YOLOv10 and YOLOv11, which have shown significant improvements in efficiency and accuracy for real-time object detection in agricultural contexts. Despite these advancements, challenges remain in detecting small or occluded objects, such as early-stage rosebuds. To address these issues, the study proposes a novel hybrid model that integrates Mamba, a state-space model known for its efficiency in modeling long-range dependencies, with YOLOv11. This integration aims to enhance feature extraction, multi-scale fusion, and contextual understanding, thereby improving the robustness and computational efficiency of UAV-based rose monitoring. The contributions of this research include the development of a hybrid detection model optimized for floriculture, comprehensive validation of its performance, and its practical applicability in real-world scenarios.
Methods
In this section, the authors describe the methodologies employed to enhance rose detection across various growth stages. They present a unified model that incorporates advanced modules and frameworks, systematically evaluating its performance. Key components discussed include the datasets utilized for training and validation, the architecture of the model, the training methodologies implemented, and the evaluation metrics used to assess the model’s effectiveness. This comprehensive approach aims to address the inherent challenges in accurately detecting roses at different developmental phases.
Discussion
The discussion section of the research paper highlights significant advancements in flower detection and real-time object detection using deep learning techniques. Notably, Shang et al. (2023) developed a lightweight YOLOv5s-based model for apple flower detection, achieving a precision of 88.4% and recall of 86.1%, which is particularly beneficial for applications like robotic flower thinning. Similarly, Rahim et al. (2022) utilized Mask R-CNN for grapevine flower quantification, achieving high F1 scores, thus demonstrating the efficacy of deep learning in agricultural monitoring. However, challenges such as occlusions and complex floral structures persist, necessitating further improvements in detection accuracy and adaptability.
In the realm of State Space Models (SSMs), recent innovations like Mamba and its derivatives have shown promise in efficiently modeling long-range dependencies in sequence tasks, outperforming traditional architectures like Transformers in terms of computational efficiency. The integration of Mamba-based modules into YOLOv11 has led to the development of Rose-Mamba-YOLO, a hybrid architecture designed for UAV-based rose detection. This model incorporates advanced spatial attention mechanisms and multi-scale feature fusion techniques, significantly enhancing its capability to detect small objects like rose buds in complex environments. The proposed enhancements collectively improve detection accuracy and computational performance, positioning Rose-Mamba-YOLO as a robust solution for real-time applications in dynamic agricultural settings.
