Cross-Species Predictions of Chromatin Annotations using Neural Networks | Prédictions Inter-Espèces d'Annotations de la Chromatine avec des Réseaux de Neurones Artificiels
2025
Maillard, Noémien | Klopp, Christophe | Cécile, Donnadieu | Demars, Julie | Mourad, Raphaël | Génétique Physiologie et Systèmes d'Elevage (GenPhySE) ; Ecole Nationale Vétérinaire de Toulouse (ENVT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-École nationale supérieure agronomique de Toulouse (ENSAT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole d'Ingénieurs de Purpan (INP - PURPAN) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Génome et Transcriptome - Plateforme Génomique (GeT-PlaGe) ; Plateforme Génome & Transcriptome (GET) ; Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL) ; Université Toulouse III - Paul Sabatier (UT3) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL) ; Université Toulouse III - Paul Sabatier (UT3) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT) ; Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP) ; Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Département de Génétique Animale (DEPT GA) ; Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRAE) ; Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE) | Université Toulouse III - Paul Sabatier (UT3) ; Université de Toulouse (UT) | International Society for Computational Biology | ANR-22-PEAE-0015,PDOC2,Agroecology and ICT : Doctoral and Post-Doctoral Program(2022)
International audience
Показать больше [+] Меньше [-]Английский. A better knowledge of functional annotations of livestock species can be a lever to link genome to phenome. The genomes of most livestock species have already been sequenced. However, data describing gene regulation mechanisms and chromatin state are insufficient. In contrast, abundant human and mouse data allowed the training of powerful deep learning algorithms. Here, we propose to use 3 artificial neural networks (Deepbind, DeepSEA and Enformer), trained with human and mouse data, to predict annotations on the pig, cattle, chicken and European seabass genomes. The predictions are then compared with experimental data to evaluate the cross-species performance of the neural networks.First, human-trained neural network predictions performed on the mouse reference genome showed varying levels of accuracy depending on the experiment, with the higher performance for H3K4me3 (auPRC=0.624). Second, the predictions on the pig, cattle and chicken genomes showed similar (lower mean auPRC=0.385+/-0.233) and better performances than those on the seabass genome (mean auPRC=0.144+/-0.096). Third, the evaluation of the impact of genomic features on the predictions highlighted better performances for CpG island and 5'UTR than other features. Finally, the comparison of predictions between different pig breeds with high genetic diversity demonstrated that genetic variability does not affect the performance, but rather observations.To conclude, we showed that the 3 neural networks evaluated can be used to predict annotations on non-mammalian genomes with similar performances (chicken), but not on genomes of organisms phylogenetically too distant (seabass).
Показать больше [+] Меньше [-]Ключевые слова АГРОВОК
Библиографическая информация
Эту запись предоставил Institut national de la recherche agronomique