Entornos de Entrenamiento para Agentes de Aprendizaje por Refuerzo en Discrete Event System Specification
DOI:
https://doi.org/10.33414/ajea.1035.2022Palabras clave:
Aprendizaje por Refuerzo, Discrete Event System Specification, Problemas de Decisión,, Energías RenovablesResumen
La dinámica y complejidad de los entornos industriales actualmente han llevado a la necesidad de soluciones que permitan capturar la interacción en tiempo real para tomar decisiones sobre el control de los procesos involucrados. El Aprendizaje por Refuerzo es un enfoque promisorio, que se aplica en problemas de decisión secuencial, donde la complejidad radica en lainteracción agente-entorno y la incertidumbre subyacente del entorno, pero requiere de una simulación que refleje el proceso bajo control (entorno) y su dinámica para entrenar el agente. En este trabajo, se presenta una solución para entrenar este tipo de agentes con entornos modelados y simulados usando Discrete Event System Specification. El mismo se aplica al problema de generación y administración de una energía alterna, biogás producido por un digestor y usado por diferentes perfiles de consumidores industriales.