書籍『ゼロから作るDeep Learning ❹ 強化学習編』(オライリー・ジャパン)のサポートサイトです。本書籍で使用するソースコードがまとめられています。
ニュース
本書の内容を確認するための「強化学習100題」を用意しています。
https://koki0702.github.io/dezero-p100/
ファイル構成
フォルダ名 | 説明 |
---|---|
ch01 | 1章で使用するソースコード |
... | ... |
ch09 | 9章で使用するソースコード |
common | 共通で使用するソースコード |
notebooks | Jupyter Notebook形式のソースコード |
pytorch | PyTorchに移植したソースコード |
Jupyter Notebook
本書のコードはJupyter Notebookでも用意しています。次の表にあるボタンをクリックすることで、Google ColabやKaggle Notebookなどのクラウドサービス上でNotebookを実行することができます。
章 | Colab | Kaggle | Studio Lab |
---|---|---|---|
1章 バンディット問題 | |||
4章 動的計画法 | |||
5章 モンテカルロ法 | |||
6章 TD法 | |||
7章 ニューラルネットワークとQ学習 | |||
8章 DQN | |||
9章 方策勾配法 |
Pythonと外部ライブラリ
ソースコードを実行するには、下記のソフトウェアが必要です。
- Python 3.x(バージョン3系)
- NumPy
- Matplotlib
- OpenAI Gym
- DeZero (または PyTorch)
本書では、ディープラーニングのフレームワークとしてDeZeroを使います。DeZeroは「ゼロから作るDeep Learning」シリーズの3作目で作ったフレームワークです( pip install dezero
からインストールできます)。
PyTorchを使った実装はpytorchフォルダにて提供しています。
実行方法
各章のフォルダに該当するコードがあります。 実行するためには、下記のとおりPythonコマンドを実行します(どのディレクトリからでも実行できます)。
$ python ch01/avg.py
$ python ch08/dqn.py
$ cd ch09
$ python actor_critic.py
ライセンス
本リポジトリのソースコードはMITライセンスです。 商用・非商用問わず、自由にご利用ください。
正誤表
本書の正誤情報は以下のページで公開しています。
https://github.com/oreilly-japan/deep-learning-from-scratch-4/wiki/errata
本ページに掲載されていない誤植など間違いを見つけた方は、japan@oreilly.co.jpまでお知らせください。