Increase in taxonomic assignment efficiency of viral reads in metagenomic studies
2018
François, Sarah | Filloux, Denis | Frayssinet, Marie | Roumagnac, Philippe | Martin, D. P. | Ogliastro, Marie Helene | Froissart, Remy | Diversité, Génomes & Interactions Microorganismes - Insectes [Montpellier] (DGIMI) ; Institut National de la Recherche Agronomique (INRA)-Université Montpellier 2 - Sciences et Techniques (UM2)-Université de Montpellier (UM) | Biologie et Génétique des Interactions Plante-Parasite (UMR BGPI) ; Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro) | Département Systèmes Biologiques (Cirad-BIOS) ; Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad) | Computational Biology Group, Institute of Infectious Disease and Molecular Medicine, Faculty of Health Sciences ; University of Cape Town | Du gène à l'écosystème (MIVEGEC-GeneSys) ; Pathogènes, Environnement, Santé Humaine (EPATH) ; Maladies infectieuses et vecteurs : écologie, génétique, évolution et contrôle (MIVEGEC) ; Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD [Occitanie])-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD [Occitanie])-Maladies infectieuses et vecteurs : écologie, génétique, évolution et contrôle (MIVEGEC) ; Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD [Occitanie])-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD [Occitanie]) | Institut National de la Recherche Agronomique (INRA)
BGPI Cirad : équipe 7
显示更多 [+] 显示较少 [-]英语. Metagenomics studies have revolutionized the field of biology by revealing the presence of many previously unisolated and uncultured micro-organisms. However, one of the main problems encountered in metagenomic studies is the high percentage of sequences that cannot be assigned taxonomically using commonly used similarity-based approaches (e.g. BLAST or HMM). These unassigned sequences are allegorically called "dark matter" in the metagenomic literature and are often referred to as being derived from new or unknown organisms. Here, based on published and original metagenomic datasets coming from virus-like particle enriched samples, we present and quantify the improvement of viral taxonomic assignment that is achievable with a new similarity-based approach. Indeed, prior to any use of similarity based taxonomic assignment methods, we propose assembling contigs from short reads as is currently routinely done in metagenomic studies, but then to further map unassembled reads to the assembled contigs. This additional mapping step increases significantly the proportions of taxonomically assignable sequence reads from a variety plant, insect and environmental (estuary, lakes, soil, feces) - of virome studies.
显示更多 [+] 显示较少 [-]