Data Augmentation para la Clasificación Automática de la Calidad Vocal

Autores/as

  • Mario Alejandro García, Doctorando Grupo de Inteligencia Artificial (GIA), Facultad Regional Córdoba, Universidad Tecnológica Nacional - Argentina
  • Eduardo Atilio Destéfanis Director

DOI:

https://doi.org/10.33414/ajea.5.748.2020

Palabras clave:

Calidad vocal, Aprendizaje profundo, Data augmentation

Resumen

Se presenta el estado del plan de tesis “Valoración de la calidad vocal a través de deep scattering spectrum y aprendizaje automático” y se plantean tres transformaciones para incrementar la cantidad de datos de entrenamiento y reducir el sobreajuste. Estas transformaciones realizan un desplazamiento en frecuencia de los datos (audios), una segmentación por tiempo y la inversión del orden temporal (flipping). Como resultado, se obtiene un juego de datos 18 veces mayor al original. Se ejecuta un experimento que consta del el entrenamiento de una red neuronal profunda para evaluar el rendimiento con los datos aumentados. Se concluye que las transformaciones propuestas disminuyen el sobreajuste, mejoran el error de clasificación y se pueden utilizar en el ámbito de este plan de tesis, clasificación de la calidad vocal a partir de audios de vocales sostenidas.

Descargas

Los datos de descargas todavía no están disponibles.

Descargas

Publicado

2020-10-05

Cómo citar

García, M. A., & Destéfanis, E. A. (2020). Data Augmentation para la Clasificación Automática de la Calidad Vocal. AJEA (Actas De Jornadas Y Eventos Académicos De UTN), (5). https://doi.org/10.33414/ajea.5.748.2020