Single Agent Actor-Critic

We implement and train a single-agent actor-critic agent based on the CNN+LSTM+Actor/Critic architecture.

We perform hyperparameter optimization on 4 key parameters:

In addition we benchmark our agent against A3C 1,4 and 16 agents implemented by ikostrikov:

An overview of our results:

Pong
Our agent achieves:

Breakout
Our agent achieves:

LUKELIEM/actor-critic