Separación de hablantes individuales en entornos "cocktail-party" mediante redes de aprendizaje profundo
2023
Cantalapiedra Arellano, Ana | San Martín Murugarren, Ricardo | Escuela Técnica Superior de Ingeniería Agronómica y Biociencias | Nekazaritzako Ingeniaritzako eta Biozientzietako Goi Mailako Eskola Teknikoa
El efecto cóctel presenta un desafío significativo para las personas con discapacidad auditiva al participar en conversaciones en entornos ruidosos. Este fenómeno, que se refiere a la dificultad de separar fuentes sonoras y detectar la fuente de interés en situaciones de múltiples hablantes, ha sido objeto de investigación en el campo de la audición y la percepción auditiva. En la última década, se han desarrollado diversos sistemas de separación de hablantes, especialmente basados en técnicas de aprendizaje profundo (deep learning), que han demostrado mejoras significativas en la separación de fuentes. En este trabajo, se empleó una base de datos de cocktail party, luego, se aplicaron los algoritmos ConvTasNET y DPRNN para separar las fuentes de audio y se evaluaron sus capacidades de rendimiento.
Show more [+] Less [-]Graduado o Graduada en Ciencia de Datos por la Universidad Pública de Navarra
Show more [+] Less [-]Datu Zientzietan Graduatua Nafarroako Unibertsitate Publikoan
Show more [+] Less [-]Bibliographic information
This bibliographic record has been provided by Public University of Navarra