Aprendizaje por Refuerzos

Repo oficial de la materia optativa Aprendizaje por Refuerzos de la Diplomatura en Ciencias de Datos, Aprendizaje Automático y sus Aplicaciones.

Instalación y ejecución

Instalación desde local

Con pip

Pasos para instalar los paquetes específicos de RL con pip (asumiendo entorno virtual de conda con instalaciones existentes de librerías comunes como numpy, matplotlib, etc):

    pip install gymnasium
    pip install stable-baselines3[extra]  # instala las dependencias necesarias para correr el lab 2
    pip install rl_zoo3  # (Opcional) instala las dependencias para usar rl-baselines-zoo

Con poetry

Pasos para instalar todos los paquetes requeridos con poetry:

Instalar poetry:

Instalar pipx
Instalar poetry con pipx:
```
  pipx install poetry
```

Comprobar que se instaló correctamente:

    poetry --version

Instalamos las dependencias (parados desde la carpeta raíz del repo):

    poetry install  # instala las dependencias necesarias
    poetry install -E zoo  # (Opcional) instala las dependencias para usar rl-baselines-zoo
    poetry install -E dev_tools  # (Opcional) instala las dependencias para usar jupyter notebooks y otras las herramientas de desarrollo

Activamos el entorno virtual:

    poetry shell

Listo! Ya podemos ejecutar los notebooks.

Ejecución

Los notebooks están preparados para ejecutarse tanto desde localhost, como desde Google Colab. En general, las simulaciones de estos notebooks se pueden ejecutar sin problemas desde localhost, ya que no demandan demasiados recursos computacionales (excepto si se ejecutan entrenamientos completos en entornos muy complejos, como en los de Atari). Algunas características sólo están disponibles en localhost, como las animaciones de los agentes en los entornos.

Algunos links útiles para aprender más

Discord de RL (muy activo y recomendado!) y su wiki de recursos!
Discord de HuggingFace (tiene canal dedicado a su curso de RL).
Comunidad de RL en reddit.
Completa entrada de blog de métodos de RL.
Awesome RL envs.
Awesome deep RL.
Libro principal de RL, por Sutton y Barto.

DiploDatos/AprendizajePorRefuerzos