Desarrollo de un paquete de herramientas bioinformáticas para evaluación de los modelos génicos en anotaciones estructurales | Development of a bioinformatic toolbox for the gene model evaluation in structural genome annotation | Desenvolupament d'un paquet d'eines bioinformàtiques per avaluar els models gènics en anotacions estructurals
2025
García Juan, Sofía | Forment Millet, José Javier | García-Carpintero Burgos, Víctor | Bombarely Gomez, Aureliano | Instituto Universitario Mixto de Biología Molecular y Celular de Plantas | Departamento de Biotecnología | Escuela Técnica Superior de Ingeniería Agronómica y del Medio Natural
[ES] Uno de los actuales cuellos de botella en el desarrollo de genomas de referencia para especies no-modelo es la anotación de los modelos génicos. Si bien existen dos tipos de metodologías para la identificación de estos (basados en evidencia, y ab-initio con modelos ocultos de Markov), no existen muchas herramientas para la evaluación de la calidad de estos modelos. GAQET (derivado de Genome Annotation Quality Evaluation Tools) es un paquete de herramientas para evaluar la calidad de las anotaciones estructurales en genomas de especies no-modelo. GAQET está escrito en Python v3 y está formado por cuatro módulos. El primero está diseñado para calcular distintas métricas sobre el archivo de anotación. El segundo ejecuta el programa BUSCO para evaluar como de completa es el espacio génico identificado. El tercero ejecuta LTR_Retriever para calcular el índice LAI sobre los elementos LTRs. El cuarto evalua los modelos génicos derivados de datos de RNA-Seq. Los resultados de los cuatro módulos se integran a través de otra herramienta a fin de crear un informe final. GAQET se ha probado en cinco anotaciones distintas de tres especies (Arabidopsis thaliana, Oryza sativa y Vitis vinifera) con distintos grados de calidad.
Mostrar más [+] Menos [-][EN] One of the main bottlenecks for the reference genome development in non-model species is the genome annotation. There are two main methodologies to identify gene models (evidence based and ab-initio using Hidden Markov Models), but there are not many tools to evaluate the gene model quality. GAQET (Genome Annotation Quality Evaluation Tools) is a toolbox designed to evaluate the quality of the structural annotation for non-model species genome. GAQET is written in Python3 and it has four modules. The first computes different metrics on the annotation GFF file. The second executes the BUSCO program to estimate gene space completeness. The third executes LTR_Retriever to compute the LAI index on the LTR elements. The fourth evaluates the gene models derived from the RNASeq data. The results of these four modules are integrated through other tool and produces a final report. GAQET has been used on five different annotations for three different species (Arabidopsis thaliana, Oryza sativa, and Vitis vinifera) with different quality degrees.
Mostrar más [+] Menos [-]García Juan, S. (2025). Desarrollo de un paquete de herramientas bioinformáticas para evaluación de los modelos génicos en anotaciones estructurales. https://riunet.upv.es/handle/10251/223947
Mostrar más [+] Menos [-]Palabras clave de AGROVOC
Información bibliográfica
Este registro bibliográfico ha sido proporcionado por Universitat Politècnica de València