MDI (Multilevel Data Integration): Intégration de données hétérogènes incluant des données «omiques»
2016
Imbert, Alyssa | de La Foye, Anne | Robert-Granié, Christèle | Yao-Lafourcade, Anne-Françoise | Hue, Isabelle | Leroux, Christine | Mobuchon, Lenha | Le Provost, Fabienne | Unité Mixte de Recherche sur les Herbivores - UMR 1213 (UMRH) ; Institut National de la Recherche Agronomique (INRA)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS) | Génétique Physiologie et Systèmes d'Elevage (GenPhySE) ; Institut National de la Recherche Agronomique (INRA)-Ecole Nationale Vétérinaire de Toulouse (ENVT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-École nationale supérieure agronomique de Toulouse (ENSAT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT) | Université Blaise Pascal - Clermont-Ferrand 2 (UBP) | Biologie du Développement et Reproduction (BDR) ; École nationale vétérinaire d'Alfort (ENVA)-Institut National de la Recherche Agronomique (INRA) | Génétique Animale et Biologie Intégrative (GABI) ; Institut National de la Recherche Agronomique (INRA)-AgroParisTech | Institut National de Recherche Agronomique (INRA). UAR Département Physiologie Animale et Systèmes d'Elevage (0558).
Champ thématique : Adaptation<br/>Champ thématique : Adaptation
Mostrar más [+] Menos [-]Francés. L’intégration de données haut-débit constitue un verrou scientifique dans le domaine de la post-génomique. Certaines méthodes statistiques permettant d’expliquer un ensemble de variables par un autre ensemble de variables de nombre très supérieur au nombre d’observations ont commencé à être développées (sPLS, rCCA, rGCCA, …). La documentation de ces méthodes reste cependant partielle et les applications sont encore rares.Dans un premier temps, nous avons comparé deux méthodes différentes de régression sparse PLS sur les données issues d’une étude de nutrigénomique de la glande mammaire de chèvres en lactation (Ollier et al., 2007). Nous avons essayé d’expliquer l’expression des ARN messagers différentiels selon l’alimentation par l’abondance des microARN différentiellement exprimés (Mobuchon et al 2015) chez les mêmes animaux tout en réduisant le nombre de variables du modèle. La méthode développée par Lê Cao & al 2008 permet de sélectionner les ARN messagers (Y) comme les microARN (X). La méthode développée par Chun & al 2010 ne permet de sélectionner que les microARN. Dans les 2 cas, des sélections préalables des variables ont été nécessaires pour identifier un bon modèle prédictif. A partir de la même sélection des ARN messagers à prédire (Y), les 2 méthodes ne fournissent pas le même nombre de miARN prédicteurs optimal, même suivant un critère a priori commun, le Mean Squared Error Prediction . Néanmoins, les résultats obtenus étaient, pour partie, attendus sur le plan biologique, confortant ainsi nos modèles. Dans un second temps, nous avons initié la mise en oeuvre d’une méthode de régression fonctionnelle adaptée à nos données (Preda & al 2011). Les méthodes fonctionnelles, si elles s’avèrent pertinentes pour des variables non ordonnées telles que les données "omiques", pourraient en effet peut-être mieux gérer : i) le fort déséquilibre entre le nombre d’observations et le nombre de variables inhérent aux données haut-débit, ii) les aspects cinétiques le cas échéant. Ce travail a fait l’objet d’un sujet de stage M2 (Imbert A., 2015) dont le financement a été assuré par le crédit incitatif.
Mostrar más [+] Menos [-]Palabras clave de AGROVOC
Información bibliográfica
Este registro bibliográfico ha sido proporcionado por Institut national de la recherche agronomique