Detección Automática de Similitudes de Código Fuente Utilizando Técnicas de Aprendizaje Automático
DOI:
https://doi.org/10.33414/ajea.4.413.2019Palabras clave:
código fuente, similitudes, reutilización, aprendizaje automático, texto, análisisResumen
En la presente propuesta de tesis se plantea el desarrollo de un modelo para detección de similitudes de código fuente para poder determinar la existencia de prácticas de reutilización aplicando técnicas vinculadas a la lingüística computacional, tales como minería de datos sobre texto y procesamiento del lenguaje natural. La identificación de similitudes de código puede servir para varios propósitos, entre los que se puede mencionar el estudio de la evolución del código fuente de un proyecto, detección de prácticas de reutilización, extracción de un fragmento de código para “refactorización” del mismo, seguimiento de defectos para su corrección, entre otros.