Este proyecto pretende encontrar una posible solución a un problema de búsqueda en un entorno dado con dos jugadores utilizando Deep Reinforcement Learning. Además, luego de encontrar un jugador al otro la tarea cambia a mantener en visibilidad el mayor tiempo posible.
- Descripción del problema
- Memoria y estados
- Función de recompensa
- Algoritmo utilizado
- Arquitectura de NN
- Curriculum Learning
- Detalles del entrenamiento
- Resultados de entrenamiento
- Resultado de prueba
El programa está diseñado en Pygame y consta de las siguientes características:
Características | Descripción |
---|---|
Dimensiondes del entorno | 200x200 px |
Obstáculos | Paredes en los bordes del entorno con ancho de 20px |
Jugadores | Discos con radio de 8px (azul → perseguidor, rojo → evasor ) |
Características | Descripción |
---|---|
Acciones |
|
Sensores |
|