Machine learning models for predicting spring wheat yield using vegetation indices | Модели машинного обучения для прогнозирования урожайности яровой пшеницы с использованием вегетационных индексов
2025
Kalichkin, V.K. | Garafutdinova, L.V. | Fedorov, D.S. | Kolbin, S.A.
Inglés. The use of vegetation indices derived by remote sensing for forecasting spring wheat yield using machine learning methods was studied. The test site was a field experiment in cultivating spring wheat under intensive agrotechnology from 2019 to 2023 at the plot located in the Novosibirsk region. Soil is leached moderately deep semi-loam chernozem. Annual Sentinel-2 satellite images with a pixel space resolution of 10 m for the June-July period were used. A preliminary analysis of the relationship between vegetation indices and wheat yield using 4 methods revealed that the most significant indices, with the highest integral importance values, were NDVI (0.63), GCI (0.47), RECI, NGRDI, and NDRE (0.40). To develop yield forecast models, Random Forest (RF), eXtreme Gradient Boosting (XGBoost), and Support Vector Regression (SVR) were used. The models used 3 datasets: the full set (21 vegetation indices), a selected subset (5 vegetation indices), and a single NDVI. The best results were achieved with the XGBoost model, which demonstrated high efficiency (R² = 0.75) for both the five-index subset and the NDVI only, with the latter achieving the lowest mean absolute error (MAE = 0.24 t/ha). The RF model also performed well on reduced datasets (R² = 0.75 with 5 vegetation indices and R²= 0.7 with NDVI). The SVR model showed a significant decline in performance as the number of traits decreased (from R²= 0.74 to R²= 0.64). The study results have practical significance for optimizing remote crop monitoring, demonstrating a feasibility of effective yield forecasting using a minimal set of spectral data.
Mostrar más [+] Menos [-]Ruso. Исследовано применение вегетационных индексов, полученных с помощью дистанционного зондирования, для прогнозирования урожайности яровой пшеницы с использованием методов машинного обучения. Тестовой площадкой служил полевой опыт по возделыванию яровой пшеницы по интенсивной агротехнологии в течение 2019–2023 гг. на участке, расположенном в Новосибирской области. Почва – чернозем выщелоченный среднемощный среднесуглинистый. Использовали ежегодные снимки за период июнь – июль спутника Sentinel-2 с пространственным разрешением 10 м в пикселе. Предварительный анализ связи вегетационных индексов с урожайностью пшеницы четырьмя методами выявил, что наиболее значимыми, показавшими наивысшие интегральные значения важности, были NDVI (0,63), GCI (0,47), RECI, NGRDI и NDRE (0,40). Для создания моделей прогнозирования урожайности пшеницы применяли случайный лес (RF), экстремальный градиентный бустинг (XGBoost) и метод опорных векторов для регрессии (SVR). В моделях использовали три набора данных: полный набор (21 вегетационный индекс), выборочный набор (пять вегетационных индексов) и с одним NDVI. Наилучшие результаты достигнуты моделью XGBoost, которая показала высокую эффективность (R² = 0,75) как на наборе из пяти признаков, так и при использовании только NDVI, причем в последнем случае достигнута наименьшая средняя абсолютная ошибка (MAE = 0,24 т/га). Модель RF также показала хорошие результаты на сокращенных наборах данных (R² = 0,75 на пяти вегетационных индексах и R² = 0,70 на NDVI). Для модели SVR отмечено существенное снижение эффективности при уменьшении количества признаков (от R² = 0,74 до R² = 0,64). Результаты исследования имеют практическое значение для оптимизации дистанционного мониторинга посевов, демонстрируя возможность эффективного прогнозирования урожайности на основе минимального набора спектральных данных.
Mostrar más [+] Menos [-]Palabras clave de AGROVOC
Información bibliográfica
Este registro bibliográfico ha sido proporcionado por Central Scientific Agricultural Library