nano-JEPA: Una propuesta para posibilitar la interpretación de video usando computadoras personales

Autores/as

  • Adrián Rostagno Universidad Tecnológica Nacional, Facultad Regional Bahía Blanca, Argentina.
  • Javier Iparraguirre Universidad Tecnológica Nacional, Facultad Regional Bahía Blanca, Argentina.
  • Joel Ermantraut Universidad Tecnológica Nacional, Facultad Regional Bahía Blanca, Argentina.
  • Guillermo R. Friedrich Universidad Tecnológica Nacional, Facultad Regional Bahía Blanca, Argentina.

Palabras clave:

Predicción de Características, Aprendizaje No Supervisado, Representación Visual, Video, JEPA

Resumen

V-JEPA es un modelo de inteligencia artificial cuyo objetivo es comprender y predecir el contenido de vídeos. Utiliza un enfoque de aprendizaje autosupervisado; se pre-entrena con datos sin etiquetar y luego se adapta a tareas específicas. Aprende a predecir partes perdidas o enmascaradas de un vídeo, obligando al modelo a comprender y desarrollar una visión integral de la escena. Pretende desarrollar una inteligencia artificial que aprenda de manera similar a los humanos, formando modelos internos del mundo que les rodea para adaptarse y completar tareas de manera eficiente. Sin embargo, sus enormes demandas computacionales, que suelen requerir potentes clústeres de GPU, limitan la accesibilidad para muchos investigadores. Por ello se propone nano-JEPA, una adaptación de V-JEPA para ejecutarse en computadoras personales, incluso sin GPU. Se presenta además el repositorio de nano-conjuntos de datos (nano-datasets), que facilita la creación de subconjuntos manejables a partir de grandes conjuntos públicos de datos de vídeo. El objetivo es permitir una mayor participación y experimentación en la investigación con modelos similares a V-JEPA. Se pudo observar un rendimiento razonable de nano-JEPA en tareas posteriores, abriendo puertas para una mayor exploración e innovación.

Descargas

Los datos de descargas todavía no están disponibles.

Métricas

Cargando métricas ...

Descargas

Publicado

2025-07-15

Cómo citar

Rostagno, A., Iparraguirre, J., Ermantraut, J., & Friedrich, G. R. (2025). nano-JEPA: Una propuesta para posibilitar la interpretación de video usando computadoras personales. AJEA (Actas De Jornadas Y Eventos Académicos De UTN), (AJEA 47). Recuperado a partir de https://rtyc.utn.edu.ar/index.php/ajea/article/view/1875

Número

Sección

Actas - Sistemas de Información e Informática