Data Augmentation para la Clasificación Automática de la Calidad Vocal

Mario Alejandro García; Eduardo Atilio Destéfanis

doi:10.33414/ajea.5.748.2020

Autores/as

Mario Alejandro García, Doctorando Grupo de Inteligencia Artificial (GIA), Facultad Regional Córdoba, Universidad Tecnológica Nacional - Argentina
Eduardo Atilio Destéfanis Director

DOI:

https://doi.org/10.33414/ajea.5.748.2020

Palabras clave:

Calidad vocal, Aprendizaje profundo, Data augmentation

Resumen

Se presenta el estado del plan de tesis “Valoración de la calidad vocal a través de deep scattering spectrum y aprendizaje automático” y se plantean tres transformaciones para incrementar la cantidad de datos de entrenamiento y reducir el sobreajuste. Estas transformaciones realizan un desplazamiento en frecuencia de los datos (audios), una segmentación por tiempo y la inversión del orden temporal (flipping). Como resultado, se obtiene un juego de datos 18 veces mayor al original. Se ejecuta un experimento que consta del el entrenamiento de una red neuronal profunda para evaluar el rendimiento con los datos aumentados. Se concluye que las transformaciones propuestas disminuyen el sobreajuste, mejoran el error de clasificación y se pueden utilizar en el ámbito de este plan de tesis, clasificación de la calidad vocal a partir de audios de vocales sostenidas.

Descargas

Métricas

Visualizaciones del PDF

437

| |

Data Augmentation para la Clasificación Automática de la Calidad Vocal

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Métricas

Descargas

Publicado

Cómo citar

Número

Sección

Artículos más leídos del mismo autor/a

ISSN

ISSN : 2683-8818

Idioma

contador

des

Número actual