fanta-mnix/vw-bandit

Python implementation of multi-armed bandit using epsilon-greedy exploration and reward-average sampling estimation

Jupyter NotebookMIT

Readme
0Issues
1Stargazer
2Watchers

No issues in this repository yet.

Topics

vowpal-wabbit multi-armed-bandit reinforcement-learning python data-science

Contact site admin: Geeks.