Machine learning methods application to the perennial grasses yield forecast model building under irrigation | Применение методов машинного обучения к построению прогнозных моделей продуктивности многолетних трав при орошении
2024
Marchenko, S.S. | Novikov, A.E. | Burtseva, N.I. | Semenenko, S.Ya.
英语. The research purpose is to test the hypothesis on possibility of building a perennial grasses yield forecast model using the machine learning methods. For agricultural production planning, the yield forecasting is one of the important tasks, and when using information technologies, building forecast models requires significantly less labor inputs while maintaining or even increasing the accuracy and adequacy of the models. Such methods were used as analysis and synthesis of various levels, methods of data preparation for machine learning, machine learning methods implementing a linear regression model and regression using decision trees. The Python machine language and publicly available libraries for data analysis and preparation and building machine learning models were used as the main technology stack for implementing the machine learning methods. The data were prepared for training the model by machine learning methods, and the data were modified without loss so as to represent exclusively numerical values. Linear regression and regression models using decision trees were trained. A metric of model quality confirmed by high values of determination coefficients (0.68 and 0.98, respectively) was calculated, by standard tools from the libraries used. It is concluded that numerical values of contribution of such signs as food regime (0.176935–0.315269), as well as the ratio of the number of irrigations and irrigation norms (0.056576–0.108139), to the model, confirm their significance for the conditions of research areas and database collection.
显示更多 [+] 显示较少 [-]俄语. Цель исследований - проверить гипотезу о возможности построения прогнозной модели урожайности многолетних трав с использованием методов машинного обучения. Для планирования с.-х. производства прогнозирование урожайности является одной из важных задач, а при использовании информационных технологий построение прогнозных моделей требует заметно меньше трудозатрат при сохранении или даже повышении точности и адекватности моделей. В исследовании применяли методы: анализ и синтез различных уровней, методы подготовки данных для машинного обучения, методы машинного обучения, реализующие модель линейной регрессии и регрессии с помощью решающих деревьев. В качестве основного стека технологий для реализации методов машинного обучения использован язык Python и общедоступные библиотеки анализа и подготовки данных и построения моделей машинного обучения. Проведена подготовка данных для тренировки модели методами машинного обучения, при этом данные видоизменены без потерь таким образом, что представляют собой исключительно числовые значения. Проведено обучение моделей линейной регрессии и регрессии с помощью решающих деревьев. С помощью стандартных инструментов используемых библиотек вычислена метрика качества моделей, подтвержденная высокими значениями коэффициентов детерминации (соответственно 0,68 и 0,98). Выводы: численные значения вклада в модель таких признаков, как пищевой режим (0,176935–0,315269), а также соотношение числа поливов и оросительной нормы (0,056576–0,108139), подтверждают их значимость для условий территории проведения исследований и набора базы данных.
显示更多 [+] 显示较少 [-]