En este curso se incluye todo lo básico relacionado con el Aprendizaje por Refuerzo. Desde los conceptos más básicos, como qué es una cadena de Markov, hasta conceptos más interesantes como la inclusión de Redes Neuronales en algoritmos de RL. Para ello, cada una de las clases cuenta con un Jupyter Notebook ejecutable con toda la teoría y con imágenes de esquemas que ayudan a una mejor comprensión. Esta pensado para que sea un curso desde 0, por ello, tanto si eres un begginer como si quieres refrescar conocimientos este curso es para ti.
Este curso está dividido en tres partes:
- Cadenas de Markov
- Procesos de Recompensa de Markov
- Procesos de Decision de Markov
- Escribiendo nuestro primer Entorno
- Descubriendo Gym
- Las acciones en los Procesos de decisión de Markov
- Calculando el Valor de los Estados
- Q: El valor de las acciones
- Programación Dinámica: Iteración de Valores
- Diferencias Temporales: Q-learning
- Breve introducción al Deep Learning
- Redes neuronales y Reinforcement Learning
- Método Cross-Entropy
- Deep Q-learning