Just7chambray/reinforcement_learning_basic_book

这是一个学习强化学习基础原理的仓库，主要包括了《深入浅出强化学习原理入门》书中一些例子和课后作业的代码

Python

代码说明

描述

这是一个我学习《深入浅出强化学习-原理入门》的学习代码仓库，主要是一些书上的例子和书后面的练习题的代码

目录

1-gym二次开发(gym develop)

2-马尔科夫决策过程(Markov Decision Process)

3-动态规划(Dynamic Program)

4-蒙特卡洛值迭代(Monte Carlo)

5-时间差分值迭代(Temporal Difference)

6-值函数逼近(Value Function Approximate)