TY - JOUR AU - Medrano, José Federico PY - 2020/12/03 Y2 - 2024/03/29 TI - Enfoque Combinado de Word2Vec y 2-grams para la Recuperación de Avisos Clasificados Inmobiliarios Semánticamente Relacionados JF - Revista Tecnología y Ciencia JA - RTyC VL - 0 IS - 39 SE - Artículos DO - 10.33414/rtyc.39.195-206.2020 UR - https://rtyc.utn.edu.ar/index.php/rtyc/article/view/799 SP - 195-206 AB - <p>La publicación de avisos clasificados de inmuebles se ha convertido en el medio de publicidad preferido tanto &nbsp;para particulares como empresas inmobiliarias. Esto ha provocado un crecimiento importante en la cantidad de avisos, tornando difícil la búsqueda un inmueble adecuado, mucho más si la búsqueda es en una gran ciudad. Este trabajo propone un enfoque basado en técnicas de minería de textos y procesamiento del lenguaje natural para la recuperación de avisos clasificados semánticamente relacionados. Para tal propósito se recolectaron los avisos publicados por el sitio web lavoz.com.ar, mediante un <em>scraper</em>. El título y la descripción de estos avisos fueron empleados para conformar un corpus textual modelado mediante <em>Word2Vec</em>, evaluando la similitud por medio de <em>Word Mover’s Distance</em>. El empleo de 2-grams (bigramas) frente a otros esquemas de agrupación de términos ofrecieron los mejores resultados comparando los resultados con búsquedas sintácticas</p> ER -