i2a-k/Reinforcement-Learning

Multi-Armed Bandit Simulation, MDP GridWorld Example, Random Walk Problem by TD and MC

Jupyter Notebook

Readme
0Issues
2Stargazers
1Watcher

No issues in this repository yet.

Topics

multi-armed-bandit n-armed-bandit-problem rl reinforcement-learning gridworld markov-decision-processes monte-carlo incremental-monte-carlo temporal-difference random-walk

Contact site admin: Geeks.