SmartDisks (IN PROGRESS ....)

Este proyecto pretende encontrar una posible solución a un problema de búsqueda en un entorno dado con dos jugadores utilizando Deep Reinforcement Learning. Además, luego de encontrar un jugador al otro la tarea cambia a mantener en visibilidad el mayor tiempo posible.

Descripción del entorno

El programa está diseñado en Pygame y consta de las siguientes características:

Características	Descripción
Dimensiondes del entorno	200x200 px
Obstáculos	Paredes en los bordes del entorno con ancho de 20px
Jugadores	Discos con radio de 8px (azul → perseguidor, rojo → evasor )

Descripción de los jugadores

Características	Descripción
Acciones	"NO ACTION": No desplazarse "LEFT": Desplazamiento de 2px hacia la izquierda "UP": Desplazamiento de 2px hacia arriba "RIGHT": Desplazamiento de 2px hacia la derecha "DOWN": Desplazamiento de 2px hacia abajo "DOUBLE-LEFT": Desplazamiento de 4px hacia la izquierda "DOUBLE-UP": Desplazamiento de 4px hacia arriba "DOUBLE-RIGHT": Desplazamiento de 4px hacia la derecha "DOUBLE-DOWN": Desplazamiento de 4px hacia abajo
Sensores	Cámara panorámica del entorno Láser desde la posición del jugador hacia las 4 direcciones hacia donde se puede desplazar

Características

Descripción

Acciones

"NO ACTION": No desplazarse
"LEFT": Desplazamiento de 2px hacia la izquierda
"UP": Desplazamiento de 2px hacia arriba
"RIGHT": Desplazamiento de 2px hacia la derecha
"DOWN": Desplazamiento de 2px hacia abajo
"DOUBLE-LEFT": Desplazamiento de 4px hacia la izquierda
"DOUBLE-UP": Desplazamiento de 4px hacia arriba
"DOUBLE-RIGHT": Desplazamiento de 4px hacia la derecha
"DOUBLE-DOWN": Desplazamiento de 4px hacia abajo

Sensores

Cámara panorámica del entorno
Láser desde la posición del jugador hacia las 4 direcciones hacia donde se puede desplazar

EnriqManComp/smart-disks-d3qn

SmartDisks (IN PROGRESS ....)

Descripción del entorno

Descripción de los jugadores

Arquitectura de red neuronal

Experience Replay

Training results