An integrated information system dedicated to oak genomics and genetics
2018
Amselem, Joëlle | Francillonne, Nicolas | Michotey, Célia | Letellier, Thomas | Aury, Jean-Marc | da Silva, Corinne | Duplessis, Sébastien | Ehrenmann, François | Faye, Sébastien | Gaspin, Christine | Klopp, Christophe | Labadie, Karine | Lesur, Isabelle | Leroy, Thibault | Murat, Florent | Rué, Olivier | Bodenes, Catherine | Leplé, Jean-Charles | Le Provost, Grégoire | Faivre Rampant, Patricia | Kremer, Antoine | Martin, Francis | Quesneville, Hadi | Salse, Jérôme | Plomion, Christophe | Unité de Recherche Génomique Info (URGI) ; Institut National de la Recherche Agronomique (INRA) | Laboratoire de Bioinformatique pour la Génomique et la Biodiversité (LBGB) ; Génomique métabolique (UMR 8030) ; Genoscope - Centre national de séquençage [Evry] (GENOSCOPE) ; Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)) ; Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)) ; Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS)-Genoscope - Centre national de séquençage [Evry] (GENOSCOPE) ; Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)) ; Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)) ; Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS) | Interactions Arbres-Microorganismes (IAM) ; Institut National de la Recherche Agronomique (INRA)-Université de Lorraine (UL) | Biodiversité, Gènes & Communautés (BioGeCo) ; Institut National de la Recherche Agronomique (INRA)-Université de Bordeaux (UB) | Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRA) ; Institut National de la Recherche Agronomique (INRA) | Genoscope - Centre national de séquençage [Evry] (GENOSCOPE) ; Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)) ; Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA) | Génétique Diversité et Ecophysiologie des Céréales (GDEC) ; Institut National de la Recherche Agronomique (INRA)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020]) | Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] (MaIAGE) ; Institut National de la Recherche Agronomique (INRA) | Etude du Polymorphisme des Génomes Végétaux (EPGV) ; Institut National de la Recherche Agronomique (INRA)
GnpIS is an information system designed to integrate and link genomic, genetic and environmental data into a single environment dedicated to plant (crops and forest trees) and fungi data. GnpIS is regularly improved with new functionalities answering specific needs raised by scientists and released several times a year. We propose to illustrate the integrated genome annotation system we set up with a focus on the interoperability between genomic and genetic data (e.g. Markers, QTL) present in GnpIS-core, through the use case Quercus robur (the pedunculate oak), a large, complex and highly heterozygous genome.This genome annotation system relies on GMOD interfaces such as WebApollo/JBrowse and Intermine to make these data available under a user-friendly environment. All annotations and analysis results (Transposable Elements (TEs), genes, ncRNA ...) and functional annotation (protein-coding genes) were obtained using powerful and robust pipelines: (i) REPET used to detect, classify and annotate TEs representing 50% of the genome; (ii) Eugene which integrates ab initio and similarity gene finding softwares to predict gene models; (iii) ncRNA were annotated using different tools to annotate lncRNA, miRNA, rRNA, tRNA (iv) A functional annotation pipeline mainly based on Interproscan and comparative genomics was performed on the 25,808 highly confident predicted proteins. This system allows experts to analyze their protein families of interest and curate/validate gene structure.All together these resources provide a framework to study the two key evolutionary processes that explain the remarkable diversity found within the Quercus genus: local adaptation and speciation.
Mostrar más [+] Menos [-]Palabras clave de AGROVOC
Información bibliográfica
Este registro bibliográfico ha sido proporcionado por Institut national de la recherche agronomique