دمج معلومات التربة مع التعلم الآلي لتوصية المحاصيل لتحسين الإنتاج الزراعي
Incorporating soil information with machine learning for crop recommendation to improve agricultural output

المجلة: Scientific Reports، المجلد: 15، العدد: 1
DOI: https://doi.org/10.1038/s41598-025-88676-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40074741
تاريخ النشر: 2025-03-12
المؤلف: Zhenyun Du وآخرون
الموضوع الرئيسي: الزراعة الذكية والذكاء الاصطناعي

نظرة عامة

تؤكد ورقة البحث على الدور الحاسم للزراعة في اقتصاد البلد، مع تسليط الضوء على التحديات التي يواجهها المزارعون في اختيار المحاصيل المناسبة لأراضيهم. يؤثر هذا القرار بشكل كبير على الإنتاجية والربحية، حيث تؤدي الخيارات غير الصحيحة إلى تقليل الغلات ونقص الغذاء. تحدد الدراسة المعايير الرئيسية التي تؤثر على اختيار المحاصيل، بما في ذلك رطوبة التربة، ومستويات العناصر الغذائية (N، K، P)، ودرجة الحموضة، وهطول الأمطار، ودرجة الحرارة. لمعالجة هذه التحديات، يقترح المؤلفون نموذج تعلم جماعي جديد، RFXG، الذي يدمج تقنيات الغابة العشوائية (RF) وتعزيز التدرج الشديد (XGB) لتوصية بأكثر المحاصيل ملاءمة من بين اثنين وعشرين خيارًا رئيسيًا. يتم التحقق من فعالية النموذج من خلال خوارزميات تعلم الآلة المختلفة، محققًا دقة توصية ملحوظة تبلغ 98%.

في الختام، يلخص المؤلفون نهجهم في تطوير نموذج RFXG الجماعي، الذي تفوق على ستة خوارزميات تعلم آلة تقليدية من حيث الدقة، ودرجة F1، والاسترجاع. تؤكد النتائج على أهمية العوامل البيئية مثل هطول الأمطار، ومستويات العناصر الغذائية، ودرجة الحرارة في تحديد صلاحية المحاصيل، مما يدعم الأدبيات الموجودة. ستركز الأعمال المستقبلية على إنشاء نماذج متقدمة من التعلم العميق وتعلم الآلة للتنبؤ بغلة المحاصيل، مما يعزز قدرة المزارعين على اتخاذ قرارات مستنيرة بشأن اختيار المحاصيل.

الطرق

تتناول المنهجية المقترحة التحديات المستمرة في تقديم توصيات فعالة للمحاصيل من خلال تطوير نماذج تعلم الآلة التي تتضمن معايير زراعية أساسية مثل النيتروجين (N)، والبوتاسيوم (K)، والفوسفور (P)، وهطول الأمطار، ودرجة الحرارة، والرطوبة، ودرجة الحموضة. الهدف الرئيسي هو التوصية بمجموعة متنوعة من المحاصيل المناسبة لكل موسم، مما يخفف من صعوبات المزارعين في اختيار المحاصيل ويعزز الغلة العامة. تشمل المنهجية عدة مراحل، بما في ذلك جمع البيانات، والمعالجة المسبقة، وتحليل البيانات الاستكشافية، وتحليل الارتباط، وتقسيم مجموعة البيانات، وتطبيق نماذج تعلم الآلة، وتوصية المحاصيل، مع نسبة تقسيم التدريب 80% ونسبة الاختبار 20%.

تستخدم الإعدادات التجريبية Python 3 لتحليل البيانات وتطوير النماذج، مستفيدة من مكتبة Scikit-learn لبناء واختبار نماذج تعلم الآلة. بالإضافة إلى ذلك، يتم استخدام TensorFlow وKeras لبناء وتقييم هذه النماذج. يتم إجراء البحث على Google Colab مع إعدادات GPU، مستفيدًا من خلفية عالية الأداء مزودة بذاكرة RAM سعتها 8GB. يتضمن الإطار الحسابي معالج Intel(R) Core(TM)i5 6300U يعمل بتردد 2.40GHz، مما يضمن معالجة فعالة للتجارب.

النتائج

يقدم قسم النتائج تحليلًا شاملاً لأداء نماذج تعلم الآلة المختلفة في التنبؤ بغلة المحاصيل بناءً على معايير مثل النيتروجين (N)، والبوتاسيوم (K)، والفوسفور (P)، وهطول الأمطار، والرطوبة، ودرجة الحرارة، ودرجة الحموضة. تستخدم التقييمات مقاييس الأداء الرئيسية، بما في ذلك الدقة، والدقة، والاسترجاع، ودرجة F1. من الجدير بالذكر أن نموذج RFXG يتفوق على جميع النماذج الأخرى، محققًا دقة، ودقة، واسترجاع، ودرجة F1 مثيرة للإعجاب تبلغ 98%. بالمقارنة، تظهر نماذج الغابة العشوائية (RF) وXGBoost (XGB) أيضًا أداءً قويًا بنسبة 96% عبر جميع المقاييس، بينما تحقق نماذج مصنف الأشجار الإضافية (ETC)، وشجرة القرار (DT)، والانحدار اللوجستي (LR) درجات أقل، حيث تحقق الشبكة العصبية متعددة الطبقات (MLP) دقة تبلغ 41% فقط.

يكشف التحليل الإضافي أن نموذج RFXG يقدم باستمرار نتائج متفوقة عبر جميع معايير المحاصيل التي تم تحليلها، مع أداء حسب الفئة يشير إلى أنه بينما سجلت معظم المحاصيل درجات فوق 0.90، سجلت البابايا أدنى درجة تبلغ 0.90. تؤكد النتائج على فعالية نموذج RFXG كأداة قوية للتنبؤ بغلة المحاصيل، متجاوزة بشكل كبير الأساليب الحالية لتعلم الآلة من حيث الدقة والموثوقية.

المناقشة

في قسم المناقشة من الورقة، يقوم المؤلفون بإجراء مراجعة شاملة للأدبيات حول أنظمة توصية المحاصيل، مع تسليط الضوء على مختلف منهجيات تعلم الآلة المستخدمة للتنبؤ بغلات المحاصيل واقتراح المحاصيل المناسبة بناءً على العوامل البيئية. يتم تحليل الدراسات الرئيسية، بما في ذلك تلك التي أجراها إينيان وآخرون، الذين استخدموا الانحدار الخطي المتعدد ونماذج الذاكرة طويلة وقصيرة المدى (LSTM) للتنبؤ بغلات المحاصيل في ماهاراشترا، محققين دقة تبلغ 86.3%. استخدم غارانايك وآخرون تقنيات تعلم آلة متنوعة، بما في ذلك الغابة العشوائية (RF) وXGBoost، لتوصية المحاصيل بناءً على ظروف التربة والمناخ، محققين دقة ملحوظة تبلغ 94.78% لغلات البصل. تؤكد المراجعة على فعالية تعلم الآلة في معالجة التحديات الزراعية، لا سيما في مناطق مثل الهند وأوكرانيا، حيث يؤثر التغير المناخي بشكل كبير على إنتاج المحاصيل.

يحدد المؤلفون الفجوات الحرجة في الأبحاث الحالية، مشيرين إلى أن العديد من الدراسات قد ركزت بشكل ضيق على محاصيل معينة أو استخدمت نماذج أبسط تحد من الأداء. يقترحون حلاً أكثر قوة يشمل مجموعة أوسع من المحاصيل ويهدف إلى تعزيز دقة التوصيات من خلال نماذج هجينة متقدمة. توضح الورقة نهجًا منهجيًا لجمع البيانات، والمعالجة المسبقة، وتحليل البيانات الاستكشافية، وتنفيذ نماذج تعلم الآلة، بما في ذلك تقنيات مثل الغابة العشوائية، وتعزيز التدرج الشديد، والنماذج الجماعية. يجمع النموذج الجماعي المقترح، RFXG، بين مزايا RF وXGBoost لتحسين دقة التنبؤ، مما يظهر الإمكانية لتعلم الآلة في تحسين الممارسات الزراعية ودعم المزارعين في التكيف مع تغير المناخ.

Journal: Scientific Reports, Volume: 15, Issue: 1
DOI: https://doi.org/10.1038/s41598-025-88676-z
PMID: https://pubmed.ncbi.nlm.nih.gov/40074741
Publication Date: 2025-03-12
Author(s): Zhenyun Du et al.
Primary Topic: Smart Agriculture and AI

Overview

The research paper emphasizes the critical role of agriculture in a country’s economy, highlighting the challenges farmers face in selecting appropriate crops for their land. This decision significantly influences productivity and profitability, with incorrect choices leading to reduced yields and food shortages. The study identifies key parameters affecting crop selection, including soil humidity, nutrient levels (N, K, P), pH, rainfall, and temperature. To address these challenges, the authors propose a novel ensemble learning model, RFXG, which integrates random forest (RF) and extreme gradient boosting (XGB) techniques to recommend the most suitable crops from a selection of twenty-two major options. The model’s effectiveness is validated through various machine learning algorithms, achieving a remarkable recommendation accuracy of 98%.

In the conclusion, the authors summarize their approach of developing the RFXG ensemble model, which outperformed six classical machine learning algorithms in terms of precision, F1-score, and recall. The findings underscore the significance of environmental factors such as rainfall, nutrient levels, and temperature in determining crop viability, corroborating existing literature. Future work will focus on creating advanced deep learning and machine learning models to predict crop yield, enhancing farmers’ ability to make informed decisions regarding crop selection.

Methods

The proposed methodology addresses the ongoing challenges in providing effective crop recommendations by developing machine learning models that incorporate essential agricultural parameters such as nitrogen (N), potassium (K), phosphorus (P), rainfall, temperature, humidity, and pH. The primary goal is to recommend a wider variety of suitable crops for each season, thereby alleviating farmers’ difficulties in crop selection and enhancing overall yield. The methodology involves several phases, including data collection, preprocessing, exploratory data analysis, correlation analysis, dataset splitting, application of machine learning models, and crop recommendation, with a training split ratio of 80% and a testing ratio of 20%.

The experimental setup employs Python 3 for data analysis and model development, utilizing the Scikit-learn library for constructing and testing machine learning models. Additionally, TensorFlow and Keras are used for building and evaluating these models. The research is conducted on Google Colab with GPU settings, leveraging a high-performance backend equipped with 8GB of RAM. The computational framework includes an Intel(R) Core(TM)i5 6300U CPU operating at 2.40GHz, ensuring efficient processing for the experiments.

Results

The results section presents a comprehensive analysis of the performance of various machine learning models in predicting crop yield based on parameters such as nitrogen (N), potassium (K), phosphorus (P), precipitation, humidity, temperature, and pH. The evaluation employs key performance metrics, including accuracy, precision, recall, and F1 score. Notably, the RFXG model outperforms all other models, achieving an impressive accuracy, precision, recall, and F1 score of 98%. In comparison, the Random Forest (RF) and XGBoost (XGB) models also demonstrate strong performance with 96% across all metrics, while the Extra Trees Classifier (ETC), Decision Tree (DT), and Logistic Regression (LR) models yield lower scores, with the Multi-Layer Perceptron (MLP) achieving only 41% accuracy.

Further analysis reveals that the RFXG model consistently delivers superior results across all crop parameters analyzed, with class-wise performance indicating that while most crops scored above 0.90, papaya recorded the lowest score of 0.90. The findings underscore the efficacy of the RFXG model as a robust tool for crop yield prediction, significantly surpassing existing machine learning approaches in accuracy and reliability.

Discussion

In the discussion section of the paper, the authors conduct a comprehensive literature review on crop recommendation systems, highlighting various machine learning methodologies employed to predict crop yields and suggest suitable crops based on environmental factors. Key studies are analyzed, including those by Iniyan et al., who utilized multiple linear regression and long short-term memory (LSTM) models to forecast crop yields in Maharashtra, achieving an accuracy of 86.3%. Garanayake et al. employed various machine learning techniques, including Random Forest (RF) and XGBoost, to recommend crops based on soil and climatic conditions, achieving a notable accuracy of 94.78% for onion yields. The review underscores the effectiveness of machine learning in addressing agricultural challenges, particularly in regions like India and Ukraine, where climate variability significantly impacts crop production.

The authors identify critical gaps in existing research, noting that many studies have focused narrowly on specific crops or employed simpler models that limit performance. They propose a more robust solution that encompasses a broader range of crops and aims to enhance the accuracy of recommendations through advanced hybrid models. The paper outlines a systematic approach to data collection, preprocessing, exploratory data analysis, and machine learning model implementation, including techniques such as Random Forest, Extreme Gradient Boosting, and ensemble models. The proposed ensemble model, RFXG, combines the strengths of RF and XGBoost to improve prediction accuracy, demonstrating the potential for machine learning to optimize agricultural practices and support farmers in adapting to climate change.