/reinforcement_learning

Final assignment of the course Applied Mathematics II

Primary LanguageHTML

Trabajo final de Taller de Matemática Aplicada II

En este trabajo vamos a aplicar técnicas de programación dinámica para obtener una política óptima en el problema de administrar un negocio de alquiler de autos. En particular vamos a utilizar el algoritmo de Iteración de Politica. Nos basamos principalmente en el capítulo 4 de Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction (2nd ed.).

Final assignment of the course Applied Mathematics II

In this work we are going to apply dynamic programming techniques to obtain an optimal policy in the problem of managing a car rental business. In particular we are going to use the Policy Iteration algorithm. We draw mainly on chapter 4 of Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction (2nd ed.).