/reinforcement_learning_basic_book

这是一个学习强化学习基础原理的仓库,主要包括了《深入浅出强化学习原理入门》书中一些例子和课后作业的代码

Primary LanguagePython

代码说明

描述

这是一个我学习《深入浅出强化学习-原理入门》的学习代码仓库,主要是一些书上的例子和书后面的练习题的代码

目录

1-gym二次开发(gym develop)

  1. gym二次开发相关文件配置
  2. 改写gym下的core.py文件
  3. 利用gym二次开发的一个网格游戏例子
  4. 利用gym二次开发的一个迷宫游戏例子

2-马尔科夫决策过程(Markov Decision Process)

  1. 学习生活的例子
  2. 里面对于迷宫的环境模拟的课后作业

3-动态规划(Dynamic Program)

  1. 网格游戏在均匀策略下的策略评估例子
  2. 策略迭代算法流程图
  3. 网格游戏在贪婪策略下的策略迭代例子
  4. 值迭代算法流程图
  5. 网格游戏在贪婪测略下的值迭代例子
  6. 迷宫游戏在动态规划下的课后作业

4-蒙特卡洛值迭代(Monte Carlo)

  1. 蒙特卡罗方法采样
  2. 蒙特卡罗方法评估

5-时间差分值迭代(Temporal Difference)

  1. Q-learning算法流程图
  2. Sarsa算法流程图
  3. Sarsa(λ)算法流程图
  4. 利用gym二次开发的一个推箱子游戏例子
  5. 利用时间差分学习推箱子实例

6-值函数逼近(Value Function Approximate)

  1. Deep Q-learning算法流程图
  2. Deep Q-learning算法模板
  3. 利用Deep Q-learning写的flappy游戏