Forecasting agricultural commodity prices from satellite data satellite data using machine learning | Prévision des prix des produits agricoles à partir de données satellitaires par apprentissage automatique
2025
Teste, Florian | Mathématiques et Informatique Appliquées (MIA Paris-Saclay) ; AgroParisTech-Université Paris-Saclay-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Université Paris-Saclay | David Makowski | Philippe Ciais
Inglés. This thesis presents a novel methodological framework for forecasting the prices and yields of agricultural products on a global scale by exclusively using satellite-derived data and advanced machine learning techniques. Traditional forecasting models often rely on weather data, econometric analyses, or agricultural production reports, which are frequently hindered by delays and inaccuracies due to the limited availability and reliability of regional data on crop production and demand.To overcome these barriers, we exploit mid-season satellite-derived biophysical parameter estimates—Gross Primary Production (GPP), Leaf Area Index (LAI), and Fraction of Absorbed Photosynthetically Active Radiation (FAPAR)—to estimate local environmental conditions and predict variations in yields and prices of agricultural products without depending on third-party reports.We examine the effectiveness of various machine learning algorithms and dimensionality reduction techniques, including Empirical Orthogonal Functions, Autoencoders, and Variational Autoencoders, to identify critical features from high-dimensional satellite images. Our forecasting framework is validated on different staple crops—maize and soy—and across diverse geographical regions, including the United States, South Africa, and Malawi. This demonstrates the generalizability and robustness of the model under varying climatic conditions and agricultural practices.The results show that our forecasting framework, based exclusively on satellite data, achieves high predictive accuracies, with coefficients of determination (( R² )) reaching up to 0.90 for maize yields and 0.79 for soybean yields. Price predictions also exhibit notable performance, with ( R² ) values of 0.48 for maize and 0.46 for soy, thereby surpassing traditional methods for early and mid-season forecasts.This work contributes to the advancement of agricultural forecasting by providing a scalable, timely, and precise tool that allows various stakeholders to make more informed decisions. The proposed forecasting tool could potentially improve the stability of global agricultural markets by providing better visibility into expected levels of production and price trends.
Mostrar más [+] Menos [-]Francés. Cette thèse développe un cadre méthodologique innovant destiné à la prévision des prix et des rendements agricoles à l'échelle mondiale, en s'appuyant exclusivement sur l'analyse de données satellitaires et l'utilisation d'algorithmes d'apprentissage automatique avancés. Alors que les modèles prévisionnels conventionnels reposent sur une combinaison de données météorologiques, d'analyses économétriques et de rapports agricoles — sources souvent affectées par des délais et des imprécisions — notre approche propose une alternative robuste et en temps réel.Notre méthodologie s'articule autour de l'exploitation de trois paramètres biophysiques clés dérivés des observations satellitaires : la Production Primaire Brute (GPP), l'Indice de Surface Foliaire (LAI) et la Fraction de Radiation Photosynthétiquement Active Absorbée (FAPAR). Ces indicateurs permettent une évaluation précise des conditions environnementales locales et une prédiction fiable des variations de rendements et de prix, s'affranchissant ainsi des limitations inhérentes aux rapports traditionnels.L'originalité de notre approche réside dans l'application d'algorithmes d'apprentissage automatique sophistiqués, couplée à des techniques avancées de réduction de la dimensionnalité. Nous explorons notamment l'utilisation des Fonctions Orthogonales Empiriques, des Autoencodeurs classiques et des Autoencodeurs Variationnels pour extraire les caractéristiques essentielles des données satellitaires complexes. La validation approfondie de notre cadre prédictif, réalisée sur différentes cultures stratégiques (maïs et soja) et diverses zones géographiques (États-Unis, Afrique du Sud, Malawi), démontre sa polyvalence et son adaptabilité.Les résultats empiriques confirment la remarquable efficacité de notre approche exclusivement satellitaire. Les prévisions de rendement atteignent des niveaux de précision exceptionnels, avec des coefficients de détermination (( R² )) de 0,90 pour le maïs et 0,79 pour le soja. Les prédictions de prix démontrent également une performance significative, avec des ( R² ) de 0,48 et 0,46 respectivement pour le maïs et le soja, surpassant notablement les méthodes conventionnelles pour les prévisions précoces et médianes de la saison.Ce travail de recherche apporte une contribution majeure au domaine de la prévision agricole en proposant un outil analytique alliant évolutivité, réactivité et précision. Au-delà des avancées méthodologiques, notre approche offre un potentiel considérable pour améliorer la stabilité des marchés agricoles mondiaux en fournissant des indicateurs précoces et fiables sur les tendances de production et de prix. Ces informations stratégiques permettront aux acteurs du secteur d'optimiser leur prise de décision et de mieux anticiper les dynamiques du marché.
Mostrar más [+] Menos [-]Palabras clave de AGROVOC
Información bibliográfica
Este registro bibliográfico ha sido proporcionado por AgroParisTech