slides and other materials
Title | Detail | Author | link |
---|---|---|---|
Introduction about RL | 强化学习简介,包含基本的要素、强化学习分类和一些例子 | 李娜 | slide |
第二章:多臂赌博机 | 多臂赌博机问题的各种经典解法,主要解决强化学习中的EE问题。 | 韩程程 | [slide](https://github.com/ECNUdase/Reinforcement-Learning-2020/blob/master/2. Multi-Armed Bandits/2. Multi-Armed Bandits.pdf) |
第五章:蒙特卡洛方法 | 利用蒙特卡洛方法进行策略评估和策略改进,包含on-policy和off-policy下的不同做法 | 刘婷婷 | slide |