Data Augmentation para la Clasificación Automática de la Calidad Vocal
DOI:
https://doi.org/10.33414/ajea.5.748.2020Palabras clave:
Calidad vocal, Aprendizaje profundo, Data augmentationResumen
Se presenta el estado del plan de tesis “Valoración de la calidad vocal a través de deep scattering spectrum y aprendizaje automático” y se plantean tres transformaciones para incrementar la cantidad de datos de entrenamiento y reducir el sobreajuste. Estas transformaciones realizan un desplazamiento en frecuencia de los datos (audios), una segmentación por tiempo y la inversión del orden temporal (flipping). Como resultado, se obtiene un juego de datos 18 veces mayor al original. Se ejecuta un experimento que consta del el entrenamiento de una red neuronal profunda para evaluar el rendimiento con los datos aumentados. Se concluye que las transformaciones propuestas disminuyen el sobreajuste, mejoran el error de clasificación y se pueden utilizar en el ámbito de este plan de tesis, clasificación de la calidad vocal a partir de audios de vocales sostenidas.