Mise en place de procédures automatisées de génotypage de SNPs cibles par séquençage chez les végétaux
2023
Bodnar, Adelin | Etude du Polymorphisme des Génomes Végétaux (EPGV) ; Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Univeristé Paris Saclay
Master
Show more [+] Less [-]English. Genotyping-by-Sequencing (GBS) is widely used in characterising the genomic diversity in crops and other cultivated plants. Considering the high number of individuals and loci, automated pipelines are necessary to easily and accurately generate genotypes and related metrics. EPGV recently developed such a pipeline to call and genotype SNP from targeted GBS data in plant species, namely STAMPS.My training aims to improve and complete this pipeline by resolving the remaining bugs and adding new functionalities. Especially, I corrected several bugs (including one when SNP is located near the end of the sequence, the so-called "target region" falling in part outside the sequence), I improved the flexibility when using the pipeline (splitting a former module to individualize the mapping analyses and variant calling steps), and making STAMPS more ergonomic by adding a Graphical User Interface (GUI), allowing to configure and run the pipeline, monitoring its progression, and show analyses results.My work allows STAMPS to be more robust and more flexible. Moreover, by maquetting the GUI, coding will be speedup and ease.STAMPS is an ongoing development, evolving with genotyping projects and technologies, and my work during this training increase the benefits linked to its modularity.
Show more [+] Less [-]French. Le génotypage par séquençage (GBS) est largement utilisé pour caractériser la diversitégénomique des espèces cultivées. L'automatisation des étapes permettant l'identificationprécise et rapide des génotypes via des pipelines est nécessaire au vu du nombre d'individus etde loci considérés. L'EPGV a récemment implémenté un pipeline d'appel de génotypes deplantes à partir de données de GBS ciblé, STAMPS.Ce stage a pour but l’amélioration de ce pipeline qui n’a pas pu être finalisé pour tous lesmodules, et nécessite des fonctionnalités supplémentaires. En particulier, il s'agissait decorriger un certain nombre de bugs (e.g. le calcul des zones cibles pour les SNP localisés enbordure de séquence), d'améliorer la flexibilité de l'utilisation du pipeline (en séparant lesétapes d'analyses de mapping et d'appel de variants, précédemment inclus dans un mêmemodule de STAMPS) et d'améliorer l'ergonomie de STAMPS en implémentant une interfacegraphique permettant de configurer et lancer le pipeline, de suivre son avancé et de visualiserun rapport d'analyse.Mon travail d'implémentation permet une meilleure robustesse et une plus grande flexibilitédans l'usage de STAMPS. Par ailleurs, en posant les bases d'une interface utilisateur (GUI) parun travail de maquettage, le codage proprement dit sera grandement facilité.STAMPS est en constante évolution par rapport aux projets et technologies de génotypage,mes nouvelles implémentations renforçant les avantages de sa modularité.
Show more [+] Less [-]AGROVOC Keywords
Bibliographic information
This bibliographic record has been provided by Institut national de la recherche agronomique