-Reinforcement-Learning-Review-and-Code 代码引用说明1: 强化学习的代码取自上海交通大学大学强化学习课题组的《动手学强化学习》书籍,此书由浅至深地讲解了强化学习自上世纪九十年代Sutton等人的理论奠基工作至本世纪诸如2019年加州伯克利大学的Model-base policy optimization等系列现代强化学习算法期间的发展历史。 代码引用说明2: 启发式算法代码源自GitHub本站,做了一些改动。读者作者可自行查找。 (侵删)