Modeling the performance of cereal-legume intercrops : an approach combining data science and community ecology. | Modéliser la performance de cultures associées céréale-légumineuse annuelles : une approche combinant écologie des communautés et science des données
2023
Mahmoud, Rémi | Mathématiques, Informatique et STatistique pour l'Environnement et l'Agronomie (MISTEA) ; Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro Montpellier ; Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro) | AGroécologie, Innovations, teRritoires (AGIR) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Communauté d'universités et établissements de Toulouse (Comue de Toulouse)-Communauté d'universités et établissements de Toulouse (Comue de Toulouse)-Ecole d'Ingénieurs de Purpan (INP - PURPAN) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Communauté d'universités et établissements de Toulouse (Comue de Toulouse)-Communauté d'universités et établissements de Toulouse (Comue de Toulouse)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Université de Montpellier | Nadine Hilgert | Pierre Casadebaig | Noémie Gaudio | ANR-16-CONV-0004,DIGITAG,Institut Convergences en Agriculture Numérique(2016)
Английский. The use of crop diversity is one of the levers for moving towards a more sustainableagriculture. In this context, cereal-legume intercrops are promising crop mixtures,especially in low-input conditions. The use of statistical models can improve ourunderstanding of the functioning of intercrops. In order to build these models, astrategy is to use data coming from the gathering of existing agronomic experimentsinvolving intercrops. In my PhD, we used a dataset including several variablesmeasured on 8 crop species (3 cereals and 5 legumes) growing in sole crops andintercrops, in 35 experiments.This type of dataset, rarely used in the literature, raises methodological issues due to itsheterogeneity. In ChapterII, we discuss the role of these datasets in agronomic research,develop a method using graph theory to identify sub-datasets inducing completefactorial plans within these global datasets, and illustrate the use of smoothing splinesas a dimension reduction method for dynamic variables.We then use the dataset in Chapter III to evaluate two key plant-plant interactionprocesses (complementarity and dominance) in cereal-legume intercrops across thewhole dataset.We then discuss the effect of two agronomic practices, species choice andfertilization, on these two processes, showing how they impact plant-plant interactions.Finally, in Chapter IV, the dataset is used to develop statistical models whoseexplanatory variables are built based on theories coming from community ecology.The goal of these models is to understand the performance of each component ofthe mixture on a subset of the dataset. Our modeling procedure includes dimensionreduction, data imputation, computation of explanatory features, variable selection(with a parsimony objective), and model fitting. The models used combine theprediction abilities of random forests with a consideration of intra-experimentationdependence of observations via a random factor. Our results highlight i) the roleof positive interactions within these low-input mixtures and ii) the predominantrole of plant-plant interactions, especially those related to cover architecture, in theperformance of these mixtures.My PhD work highlights the usefulness of community ecology in understanding thefunctioning of complex agroecosystems and the promising potential of using globaldatasets in agronomy analyzed with advanced statistical methods.
Показать больше [+] Меньше [-]Французский. L’utilisation de la diversité végétale cultivée est l’un des leviers pour s’orienter vers une agriculture plus durable. Dans ce contexte, les cultures associées céréale-légumineuse sont des mélanges prometteurs, notamment en conditions bas-intrants. L’utilisation de modèles statistiques peut améliorer notre compréhension du fonctionnement de ces cultures. Pour construire ces modèles, une stratégie est d’utiliser les données issues de l’agrégation d’expérimentations mettant en jeu ces cultures. Dans mon travail de thèse, nous partons d’un jeu de données de plusieurs variables mesurées sur 8 espèces (3 céréales et 5 légumineuses) en culture pure et en culture associée, dans 35 expérimentations. Ce type de jeu de données, peu utilisé dans la littérature, soulève des questions méthodologiques de par son hétérogénéité. Dans le Chapitre II, nous discutons du rôle de ces jeux des données dans la recherche agronomique, mettons au point une méthode utilisant la théorie des graphes pour identifier des sous-jeux de donnéesinduisant des plans factoriels complets au sein de ces jeux de données globaux etillustrons l’utilisation de splines de lissage comme méthode de réduction de dimension de variables temporelles. Nous utilisons ensuite, dans le Chapitre III, ce jeu de données pour évaluer deux processus clés d’interactions entre plantes (complémentarité et dominance), à l’oeuvre dans les cultures associées céréale-légumineuse sur l’ensemble du jeu de données. Puis nous discutons de l’effet de deux pratiques agronomiques, le choix des espèces associées et la fertilisation, sur ces deux processus, en montrant la perturbation desinteractions plante-plante induite par ces pratiques. Enfin, dans le Chapitre IV, le jeu de données est utilisé pour développer des modèles statistiques dont les variables explicatives sont construites à partir de théories issues de l’écologie des communautés et permettant de comprendre la performance de chacune des composantes du mélange sur un sous-ensemble du jeu de données. Notre procédure de modélisation inclut réduction de dimension, imputation des données, calcul des variables explicatives, sélection de variables (dans un objectif de parcimonie) et ajustement des modèles. Les modèles utilisés combinent les capacités de prédiction des forêts aléatoires à une prise en compte de la dépendance intra-expérimentation des observations via un facteur aléatoire. Nos résultats soulignent i) le rôle des interactions positives au sein de ces mélanges en conditions bas-intrants ainsi que ii) la place prépondérante des interactions plante-plante, notamment celles liées à l’architecture du couvert dans la performance de ces mélanges. Mon travail de thèse souligne l’utilité de l’écologie des communautés dans la compréhension du fonctionnement d’agroécosystèmes complexes et le potentiel prometteur de l’utilisation de jeux de données globaux en agronomie analysés avec des méthodes statistiques avancées.
Показать больше [+] Меньше [-]Ключевые слова АГРОВОК
Библиографическая информация
Эту запись предоставил Institut national de la recherche agronomique