• 本

ゼロから作るDeep Learning 4

強化学習編

出版社名 オライリー・ジャパン
出版年月 2022年4月
ISBNコード 978-4-87311-975-5
4-87311-975-8
税込価格 3,960円
頁数・縦 355P 21cm
シリーズ名 ゼロから作るDeep Learning

商品内容

要旨

人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。

目次

1章 バンディット問題
2章 マルコフ決定過程
3章 ベルマン方程式
4章 動的計画法
5章 モンテカルロ法
6章 TD法
7章 ニューラルネットワークとQ学習
8章 DQN
9章 方策勾配法
10章 さらに先へ
付録

出版社・メーカーコメント

超人気シリーズの第4弾??今回のテーマは強化学習!人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。

著者紹介

斎藤 康毅 (サイトウ コウキ)  
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです)