/PPO.NETv2

PPO.NETv2 is an implementation of Proximal Policy Optimization (PPO) using TensorFlow with comments in Portuguese. The environment used is CartPole-v0 from OpenAI Gym.

Primary LanguageC#MIT LicenseMIT

PPO_tf

Implementação da proximal policy optimization (PPO) usando tensorflow com comentários em português

Ambiente

CartPole-v0 do open ai gym
espaço de estado: contínuo espaço de ação: discreto

Dependencias

python3.6
tensorflow v1.4
open ai gym

Treinamento

python main.py 

Testar politica treinada

python test_policy.py

Tensorboard

tensorboard --logdir=log

LICENÇA

MIT LICENSE