書籍『ゼロから作るDeep Learning ❹ 強化学習編』(オライリー・ジャパン)のサポートサイトです。本書籍で使用するソースコードがまとめられています。

ニュース

本書の内容を確認するための「強化学習100題」を用意しています。

https://koki0702.github.io/dezero-p100/

ファイル構成

フォルダ名 説明
ch01 1章で使用するソースコード
... ...
ch09 9章で使用するソースコード
common 共通で使用するソースコード
notebooks Jupyter Notebook形式のソースコード
pytorch PyTorchに移植したソースコード

Jupyter Notebook

本書のコードはJupyter Notebookでも用意しています。次の表にあるボタンをクリックすることで、Google ColabやKaggle Notebookなどのクラウドサービス上でNotebookを実行することができます。

Colab Kaggle Studio Lab
1章 バンディット問題 Open In Colab Kaggle Open In SageMaker Studio Lab
4章 動的計画法 Open In Colab Kaggle Open In SageMaker Studio Lab
5章 モンテカルロ法 Open In Colab Kaggle Open In SageMaker Studio Lab
6章 TD法 Open In Colab Kaggle Open In SageMaker Studio Lab
7章 ニューラルネットワークとQ学習 Open In Colab Kaggle Open In SageMaker Studio Lab
8章 DQN Open In Colab Kaggle Open In SageMaker Studio Lab
9章 方策勾配法 Open In Colab Kaggle Open In SageMaker Studio Lab

Pythonと外部ライブラリ

ソースコードを実行するには、下記のソフトウェアが必要です。

  • Python 3.x(バージョン3系)
  • NumPy
  • Matplotlib
  • OpenAI Gym
  • DeZero (または PyTorch)

本書では、ディープラーニングのフレームワークとしてDeZeroを使います。DeZeroは「ゼロから作るDeep Learning」シリーズの3作目で作ったフレームワークです( pip install dezero からインストールできます)。

PyTorchを使った実装はpytorchフォルダにて提供しています。

実行方法

各章のフォルダに該当するコードがあります。 実行するためには、下記のとおりPythonコマンドを実行します(どのディレクトリからでも実行できます)。

$ python ch01/avg.py
$ python ch08/dqn.py

$ cd ch09
$ python actor_critic.py

ライセンス

本リポジトリのソースコードはMITライセンスです。 商用・非商用問わず、自由にご利用ください。

正誤表

本書の正誤情報は以下のページで公開しています。

https://github.com/oreilly-japan/deep-learning-from-scratch-4/wiki/errata

本ページに掲載されていない誤植など間違いを見つけた方は、japan@oreilly.co.jpまでお知らせください。