Esta demo (Realizada para la asignatura de Inteligencia Artificial) consiste en un juego de lucha cuya programación de inteligencia artificial consiste en la técnica de aprendizaje reforzado.
Esta técnica funciona poniendo que los objetivos se pueden expresar a través de una función (recompensa) que asigna un valor numérico por cada acción que el agente ejecuta en cada estado. El entorno transita en un nuevo estado, devolviendo un valor que define lo buena que fue la última acción. El agente utiliza esta información para aprender la política de control, que determina la siguiente acción a ejecutar.
Fue programada usando la técnica de pair-programming para la asignatura de Inteligencia Artificial de la Universidad ESNE.