Unlocking the Soil Microbiome: Unraveling Soil Microbial Complexity Using Long-Read Metagenomics | Découvrir le microbiome du sol : Révéler la complexité microbienne du sol à l'aide de la métagénomique à lecture longues
2024
Belliardo, Carole | Maurice, Nicolas | Frioux, Clémence | Lemaitre, Claire | Vicedomini, Riccardo | Mondy, Samuel | Péré, Arthur | Bailly-Bechet, Marc | Danchin, Etienne | Institut Sophia Agrobiotech (ISA) ; Université Nice Sophia Antipolis (1965 - 2019) (UNS)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Côte d'Azur (UniCA) | Scalable, Optimized and Parallel Algorithms for Genomics (GenScale) ; Centre Inria de l'Université de Rennes ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7) ; Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA) ; Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique) ; Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique) ; Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA) ; Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique) ; Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique) ; Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT) | Pleiade, from patterns to models in computational biodiversity and biotechnology (PLEIADE) ; Laboratoire Bordelais de Recherche en Informatique (LaBRI) ; Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Centre Inria de l'Université de Bordeaux ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Biodiversité, Gènes & Communautés (BioGeCo) ; Université de Bordeaux (UB)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Institut des sciences informatiques et de leurs interactions - CNRS Sciences informatiques (INS2I-CNRS) | Institut de Biologie Intégrative de la Cellule (I2BC) ; Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS) | Institut National des Sciences Appliquées de Lyon (INSA Lyon) ; Université de Lyon-Institut National des Sciences Appliquées (INSA) | France Génomique and the GDR GE | ANR-22-PEAE-0011,MISTIC,Computationel models of crop plant microbial biodiversity(2022)
International audience
Show more [+] Less [-]English. The soil microbiome remains poorly understood, but unravelling its genetic diversity is essential, given the pivotal functions primarily mediated through their protein arsenal [1]. Although short-read (SR) shotgun metagenomics provided exciting insights into microbiome gene diversity, it failed to deliver comprehensive microbial genome reconstructions. Metagenome-assembled genomes (MAGs) obtained from SR often yield fragmented assemblies and incomplete gene sets (over 90% contigs <1kb and thus unusable for gene prediction) [2]. Using PacBio HiFi sequencing, we obtained long-reads (N50: 6kb) from tunnel culture soil metagenomes, surpassing the contig length of publicly available short-read metagenomes (N50: 1kb) [2]. Even if a substantial part of the reads remain unassembled, we succeeded in reconstructing dozens of MAGs, further enhancing reads contiguity encompassing bacterial, archaeal, and viral genomes from terrestrial environments. HiFi LR sequencing exhibits significant potential in elucidating the complexity of bacterial genome reconstruction. However, several critical considerations remain, such as the comprehensive scope of biodiversity captured by the LR approach compared to deep sequencing with SR.1. Fierer, N., 2017. Nat Rev Microbiol 2. Belliardo, C., et al., 2022, Scientific Data 9, 311
Show more [+] Less [-]French. Le microbiome du sol reste mal caractérisés, mais comprendre sa diversité génétique est essentiel, étant donné les fonctions primordiales principalement médiées par leur arsenal protéique. Bien que la métagénomique shotgun à lectures courtes (SR) ait fourni des informations sur la diversité des gènes du microbiome, elle n'a pas réussi à fournir des reconstructions génomiques microbiennes complètes. Les génomes assemblés à partir de métagénomes (MAGs) obtenus à partir de SR donnent souvent des assemblages fragmentés et des ensembles de gènes incomplets (plus de 90 % de contigs <1 kb et donc inutilisables pour la prédiction de gènes). En utilisant le séquençage PacBio HiFi, nous avons obtenu des lectures longues (N50 : 6 kb) à partir de métagénomes de sol en culture tunnel, dépassant la longueur de contig des métagénomes à lectures courtes disponibles publiquement (N50 : 1 kb). Même si une partie substantielle des lectures reste non assemblée, nous avons réussi à reconstruire des dizaines de MAGs, améliorant encore la contiguïté des lectures de génomes bactériens, archéens et viraux issus d'environnements terrestres. Le séquençage LR HiFi présente un potentiel significatif pour élucider la complexité de la reconstruction du génome bactérien. Cependant, plusieurs considérations critiques subsistent, telles que l'étendue de la biodiversité capturée par l'approche LR par rapport au séquençage en profondeur SR.
Show more [+] Less [-]Bibliographic information
This bibliographic record has been provided by Institut national de la recherche agronomique