• 本

Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習

出版社名 オーム社
出版年月 2018年8月
ISBNコード 978-4-274-22253-5
4-274-22253-5
税込価格 3,080円
頁数・縦 235P 21cm

商品内容

要旨

Pythonで動作する深層強化学習フレームワーク「ChainerRL」を用いて、深層強化学習を実際に使いこなすことに焦点を当て、開発環境の構築から深層学習、強化学習、深層強化学習とステップアップ方式で、基礎から実際のモノを制御する応用までを解説。

目次

第1章 はじめに(深層強化学習でできること
本書の構成 ほか)
第2章 深層学習(深層学習とは
ニューラルネットワーク ほか)
第3章 強化学習(強化学習とは
強化学習の原理 ほか)
第4章 深層強化学習(深層強化学習とは
ネズミ学習問題への適用 ほか)
第5章 実環境への応用(カメラで環境を観察する(MNIST)
実環境でのネズミ学習問題 ほか)

著者紹介

牧野 浩二 (マキノ コウジ)  
1975年神奈川県横浜市生まれ。1994年神奈川県立横浜翠嵐高等学校卒業。2001年東京工業大学大学院理工学研究科制御システム工学専攻修了。株式会社本田技術研究所研究員。2008年東京工業大学大学院理工学研究科制御システム工学専攻修了。博士(工学)。財団法人高度情報科学技術研究機構研究員。2009年東京工科大学コンピュータサイエンス学部助教。2013年山梨大学大学院総合研究部工学域助教。これまでに地球シミュレータを使用してナノカーボンの研究を行い、Arduinoを使ったロボコン型実験を担当した。マイコンからスーパーコンピュータまでさまざまなプログラミング経験を持つ。おもに、人間の暗黙知(分かっているけど言葉に表せないエキスパートが持つ知識)に取り組んでおり、計測機器開発からデータ解析まで一貫した研究を行っている
西崎 博光 (ニシザキ ヒロミツ)  
1975年兵庫県佐用町生まれ。1996年津山工業高等専門学校情報工学科卒業。2003年豊橋技術科学大学大学院工学研究科博士課程電子・情報工学専攻修了。博士(工学)。山梨大学大学院医学工学総合研究部助手。2015年国立台湾大学電機情報学院客員研究員。2016年山梨大学大学院総合研究部工学域准教授。おもに、音声情報処理の研究に取り組んでおり、特に音声認識や大規模音声データベースから該当する音声を見つけ出す音声ドキュメント検索の研究を行っている。最近では、音声認識や検索技術を活かしたノートテイキングや技術伝承支援の研究に従事している(本データはこの書籍が刊行された当時に掲載されていたものです)