Detección automática de similitudes de código fuente utilizando técnicas de aprendizaje automático
DOI:
https://doi.org/10.33414/ajea.1069.2022Palabras clave:
código fuente, similitudes, reutilización, aprendizaje automático, texto, análisisResumen
En el presente trabajo se plantea el desarrollo de un modelo para detección de similitudes de código fuente para poder determinar la existencia de prácticas de reutilización aplicando técnicas vinculadas al aprendizaje automático con un enfoque a la lingüística computacional. Existen diversas técnicas desarrolladas por diversos autores que permiten la detección de fragmentos de código fuente similares (usualmente llamados Clones de Código o Code Clones) enfocados en los distintos tipos de clones. La identificación de estos clones de código fuente puede servir para varios propósitos, entre los que se puede mencionar el estudio de la evolución del código fuente de un proyecto, detección de prácticas de reutilización, extracción de un fragmento de código para “refactorización” del mismo, detección y seguimiento de defectos, fallas y/o virus para su corrección, entre otros.