dksifoua/Reinforcement-Learning

Jupyter NotebookApache-2.0

Readme
0Issues
1Stargazer
1Watcher

Reinforcement Learning

TODO

Decision Making Under Uncertainty
Markov Decision Processes
Values Functions & Bellman Equations
Dynamic Programming
Monte Carlo Methods
Temporal Difference Methods
Planning, Learning & Acting
On-Policy Prediction with Approximation
Constructing Features for Prediction
Control with Approximation
Policy Gradient Methods
- REINFORCE
- Actor-Critic
- Off-Policy Policy Gradient
- A2C
- A3C
- DDPG
- PPO
- SAC
- TD3

Topics

actor-critic advantage-actor-critic asynchronous-advantage-actor-critic dyna-q dynamic-programming markov-decision-processes monte-carlo policy-gradient proximal-policy-optimization q-learning reinforce reinforcement-learning sarsa temporal-difference

Share to

Contact site admin: Geeks.