Un Enfoque Jerárquico Bi-capa de Optimización Bayesiana de Hiper-parámetros en Aprendizaje por Refuerzos

Juan Cruz Barsce; Ernesto Martínez; Jorge Palombarini

doi:10.33414/ajea.5.744.2020

Autores/as

Juan Cruz Barsce, Doctorando Grupo de investigación en simulación para Energía Química, Facultad Regional Villa María, Universidad Tecnológica Nacional - Argentina
Ernesto Martínez Director
Jorge Palombarini Codirector

DOI:

https://doi.org/10.33414/ajea.5.744.2020

Palabras clave:

aprendizaje por refuerzos, optimización de hiper-parámetros, optimización Bayesiana, optimización Bayesiana de estructuras combinatoriales

Resumen

La optimización de hiper-parámetros en algoritmos de aprendizaje por refuerzos (RL) es una tarea clave, porque los mismos determinan cómo el agente aprenderá su política interactuando con su ambiente, y por lo tanto cómo los datos son recolectados. Se aquí un enfoque que aplica optimización Bayesiana para realizar una optimización de dos pasos: en primer lugar, los hiper-parámetros categóricos de RL son tomados como variables binarias y optimizados con una función de adquisición acorde. Luego, a un menor nivel de abstracción, se optimizan los hiper-parámetros directamente relacionados con la solución del problema con la función de adquisición de mejora esperada, usando los mejores hiper-parámetros categóricos encontrados en el nivel de abstracción superior. Este enfoque bi-capa es validado en tareas de control clásicas, arrojando resultados promisorios que abren camino a aplicaciones de RL independientes de usuario.

Un Enfoque Jerárquico Bi-capa de Optimización Bayesiana de Hiper-parámetros en Aprendizaje por Refuerzos

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Descargas

Publicado

Cómo citar

Número

Sección

ISSN

ISSN : 2683-8818

Idioma

contador

des

Número actual