Extension of Hidden (semi-)Markov Models and algorithms to estimate the dynamics of partially observable (meta)populations | Extension des modèles de (semi-)Markov cachés et algorithmes pour estimer la dynamique de (méta)populations partiellement observables
2024
Bacave, Hanna | Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRAE) ; Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | ANR HSMM INCA | Département MathNum INRAE | Université Paul Sabatier (Toulouse) | Nathalie Peyrard | Pierre-Olivier Cheptou | Nikolaos Limnios | ANR-21-CE40-0005,HSMM-INCA,Modèles de Semi Markov Cachés: Inférence, Contrôle et Applications(2021)
英语. In ecology, understanding population dynamics plays a key role in the study of ecosystems. However, in some species, it is not possible to observe populations at all stages of their dynamics, as some stages are hidden. We refer to these as Partially Observable Populations (POP). Hidden Markov Models (HMM) are effective for modeling their dynamics, but the assumptions of conditional independence can be too strong. Indeed, they do not account for the interactions between the hidden sub-population (part of the population in an unobservable life stage) and the observed sub-population.This is why we introduce Observation-Driven Hidden Markov Models (OD-HMM) to model the influence of the observed sub-population on the state of the hidden sub-population. In the non-parametric framework, we propose a theoretical study of the model: analysis of its identifiability and the consistency of its maximum likelihood estimator. From an operational perspective, we develop the associated EM algorithm. Finally, we illustrate the relevance of the OD-HMM on the dynamics of plant populations with dormant seed banks.We then discuss the limitations specific to the OD-HMM. Seed dormancy, which can last several years, makes the OD-HMM (where the probability of changing state does not depend on the time spent in the current state) unsuitable. Drawing inspiration from Hidden Semi-Markov Models (HSMM), we therefore propose the OD-HSMM. Theoretically, we discuss its formalization and present a parameterization of this model based on key parameters of plant dynamics. Algorithmically, we explore two estimation approaches: the EM algorithm and the ABC algorithm.The dynamics of natural POPs depend on those of neighboring POPs of the same species. To model this, while considering their interactions within the metapopulation, we focus on interacting Partially Observable Dynamic Bayesian Networks (PO-DBN). Thus, we propose a conceptual guide for modeling and estimating the parameters involved in the dynamics of most metapopulations with Partially Observable Populations (M-POP), which can be grouped according to four interaction structures.This work thus extends the framework of HMMs in three ways: first, by introducing the OD-HMM to more realistically model the dynamics of POPs; second, by developing the OD-HSMM to account for the duration during which the hidden sub-population remains in the same state; and finally, by exploring interacting PO-DBNs for realistic modeling of the entire M-POP. It provides both theoretical and algorithmic insights for the inference of these models.
显示更多 [+] 显示较少 [-]法语. En écologie, comprendre la dynamique des populations joue un rôle clé dans l'étude des écosystèmes. Cependant, chez certaines espèces, il n'est pas possible d'observer les populations à tous les stades de leur dynamique, certains étant cachés. Nous les qualifions de populations partiellement observables (Partially Observable Population, POP). Les modèles de Markov cachés (Hidden Markov Models, HMM) sont efficaces pour modéliser leur dynamique, mais les hypothèses d'indépendance conditionnelle peuvent être trop fortes. En effet, elles ne tiennent pas compte des interactions entre la sous-population cachée (partie de la population dans un stade de vie non observable) et celle observée.C'est pourquoi nous introduisons les HMM pilotés par l'observation (Observation-Driven HMM, OD-HMM) pour modéliser l'influence de la sous-population observée sur l'état de la sous-population cachée. Dans le cadre non paramétrique, nous proposons une étude théorique du modèle : analyse de son identifiabilité et de la consistance de son estimateur du maximum de vraisemblance. D'un point de vue opérationnel, nous développons l'algorithme EM associé. Nous illustrons enfin l'intérêt de l'OD-HMM sur la dynamique de populations de plantes avec banque de graines dormantes.Nous discutons par la suite des limites propres à l'OD-HMM. La dormance des graines pouvant être de plusieurs années rend l'OD-HMM (dont la probabilité de changer d'état ne dépend pas du temps passé dans ce dernier) inadapté. En nous inspirant des modèles de semi-Markov cachés (Hidden Semi-Markov Models, HSMM), nous proposons donc l'OD-HSMM. Sur le plan théorique, nous discutons sa formalisation et présentons une paramétrisation de ce modèle à partir des paramètres clés de la dynamique des plantes. Algorithmiquement, nous explorons deux approches d'estimation : l'algorithme EM et l'algorithme ABC.La dynamique des POP naturelles dépend de celles des POP voisines de la même espèce. Pour la modéliser, tout en tenant compte de leurs interactions au sein de la métapopulation, nous nous intéressons aux réseaux bayésiens dynamiques partiellement observables (Partially Observable Dynamic Bayesian Networks, PO-DBN) en interaction. Ainsi, nous proposons un guide conceptuel pour modéliser et estimer les paramètres impliqués dans la dynamique de la majorité des métapopulations avec populations partiellement observables (Metapopulation with Partially Observable Populations, M-POP), qui peuvent être regroupées selon quatre structures d'interactions. Ce travail élargit donc le cadre des HMM selon trois axes : d'abord en introduisant l'OD-HMM pour modéliser de manière plus réaliste la dynamique des POP, ensuite en développant l'OD-HSMM pour tenir compte de la durée pendant laquelle la sous-population cachée demeure dans un même état et enfin en explorant les PO-DBN en interaction pour une modélisation réaliste de toute la M-POP. Il apporte un regard à la fois théorique, mais aussi algorithmique, pour l'inférence de ces modèles.
显示更多 [+] 显示较少 [-]