GitHub - Hiro-0110/deep-learning-from-scratch-4

書籍『ゼロから作るDeep Learning ❹ 強化学習編』(オライリー・ジャパン)のサポートサイトです。本書籍で使用するソースコードがまとめられています。

ニュース

本書の内容を確認するための「強化学習100題」を用意しています。

https://koki0702.github.io/dezero-p100/

ファイル構成

フォルダ名	説明
ch01	1章で使用するソースコード
...	...
ch09	9章で使用するソースコード
common	共通で使用するソースコード
notebooks	Jupyter Notebook形式のソースコード
pytorch	PyTorchに移植したソースコード

Jupyter Notebook

本書のコードはJupyter Notebookでも用意しています。次の表にあるボタンをクリックすることで、Google ColabやKaggle Notebookなどのクラウドサービス上でNotebookを実行することができます。

章	Colab	Kaggle	Studio Lab
1章バンディット問題
4章動的計画法
5章モンテカルロ法
6章 TD法
7章ニューラルネットワークとQ学習
8章 DQN
9章方策勾配法

Pythonと外部ライブラリ

ソースコードを実行するには、下記のソフトウェアが必要です。

Python 3.x（バージョン3系）
NumPy
Matplotlib
OpenAI Gym
DeZero （または PyTorch）

本書では、ディープラーニングのフレームワークとしてDeZeroを使います。DeZeroは「ゼロから作るDeep Learning」シリーズの3作目で作ったフレームワークです（ pip install dezero からインストールできます）。

PyTorchを使った実装はpytorchフォルダにて提供しています。

実行方法

各章のフォルダに該当するコードがあります。実行するためには、下記のとおりPythonコマンドを実行します（どのディレクトリからでも実行できます）。

$ python ch01/avg.py
$ python ch08/dqn.py

$ cd ch09
$ python actor_critic.py

ライセンス

本リポジトリのソースコードはMITライセンスです。商用・非商用問わず、自由にご利用ください。

正誤表

本書の正誤情報は以下のページで公開しています。

https://github.com/oreilly-japan/deep-learning-from-scratch-4/wiki/errata

本ページに掲載されていない誤植など間違いを見つけた方は、[email protected]までお知らせください。

Name		Name	Last commit message	Last commit date
Latest commit History 79 Commits
ch01		ch01
ch04		ch04
ch05		ch05
ch06		ch06
ch07		ch07
ch08		ch08
ch09		ch09
common		common
notebooks		notebooks
pytorch		pytorch
.gitignore		.gitignore
LICENSE.md		LICENSE.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ニュース

ファイル構成

Jupyter Notebook

Pythonと外部ライブラリ

実行方法

ライセンス

正誤表

About

Releases

Packages

Languages

License

Hiro-0110/deep-learning-from-scratch-4

Folders and files

Latest commit

History

Repository files navigation

ニュース

ファイル構成

Jupyter Notebook

Pythonと外部ライブラリ

実行方法

ライセンス

正誤表

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages