Deep Reinforcement Learning

Desenvolvimento de um Agente Artificial treinado com o algoritmo Deep Q-Learning com auxílio de uma Rede Neural Recorrente LSTM Siamesa (duas entradas: uma entrada para o texto do estado e outro para as possíveis ações a serem tomadas neste estado corrente).

O Projeto foi realizado levando em conta os seguintes resultados publicados:

Using Reinforcement Learning to learn how to play text-based games (Mikuláš Zelinka, 2018).
Language Understanding for Text-based Games using DeepReinforcement Learning (Karthik Narasimhan, Tejas Kulkarni, Regina Barzilay, 2017).
Playing Atari with Deep Reinforcement Learning (Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou Daan Wierstra, Martin Riedmiller, 2013).

O Emulador do jogo foi totalmente desenvolvido por mim. No momento é composto apenas por 14 estados e de transições de estado determinísticas. A escolha de fase de inicialização do jogo já é feita de forma estocástica.

Melhorias a serem implementadas:

Implementação do algoritmo Double Deep Q-Learning, de forma a tornar o treinamento mais estável.
Replay de memória de experiência de forma eficiente. Numa próxima implementação, usar Listas de Prioridades, onde a chave de prioridade é o TD Error.

Integrantes do Projeto:

Gabriel de Miranda, UERJ, gabrieliprj@gmail.com
Karla Tereza Figueiredo, PUC-RJ/UERJ, karla.figueiredo@gmail.com.

ograndoptimist/FaperjRL

Deep Reinforcement Learning