• 本

Vision Transformer入門 新しいコンピュータビジョンの世界

Computer Vision Library

出版社名 技術評論社
出版年月 2022年9月
ISBNコード 978-4-297-13058-9
4-297-13058-0
税込価格 3,520円
頁数・縦 263P 23cm

商品内容

目次

第1章 TransformerからVision Transformerへの進化
第2章 Vision Transformerの基礎と実装
第3章 実験と可視化によるVision Transformerの探求
第4章 コンピュータビジョンへの応用
第5章 Vision and Languageへの応用
第6章 Vision Transformerの派生手法
第7章 Transformerの謎を読み解く
第8章 Vision Transformerの謎を読み解く

出版社・メーカーコメント

自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。目次1章 TransformerからViTへの進化2章 Vision Transformerの基礎と実装3章 実験と可視化によるViTの探求4章 コンピュータビジョンへの応用5章 Vision and Languageへの応用6章 ViTの派生手法7章 Transformerの謎を読み解く8章 Vision Transformerの謎を読み解く

著者紹介

片岡 裕雄 (カタオカ ヒロカツ)  
国立研究開発法人産業技術総合研究所人工知能研究センター主任研究員。2014年慶應義塾大学大学院理工学研究科後期博士課程修了、博士(工学)。2020年10月より国立研究開発法人産業技術総合研究所主任研究員。画像認識、動画解析、人物行動解析に従事。2011/2020年VIEW小田原賞、2019年度産総研論文賞、ACCV 2020 BEST PAPER HONORABLE MENTION AWARD受賞
山本 晋太郎 (ヤマモト シンタロウ)  
2022年3月に早稲田大学先進理工学研究科物理学及応用物理学専攻にて博士後期課程を修了し、博士(工学)を取得。学生時代は主にコンピュータビジョンと自然言語処理の分野の研究に従事。博士論文のテーマは、効率的な研究コミュニケーションのための科学論文解析。現在は企業の研究開発部門に勤める会社員
徳永 匡臣 (トクナガ マサオミ)  
株式会社野村総合研究所AIソリューション推進部AI tech lab.所属。2019年3月、東北大学工学部を卒業。2021年3月、東京工業大学大学院情報理工学院情報工学系知能情報コースにて修士課程を修了。現在は、コンピュータビジョンおよび自然言語処理の業務に従事
箕浦 大晃 (ミノウラ ヒロアキ)  
中部大学大学院工学研究科情報工学専攻博士後期課程3年。2020年中部大学大学院博士前期課程情報工学専攻修了。同大学大学院博士後期課程情報工学専攻在学中。コンピュータビジョン、パターン認識の研究に従事
QIU YUE (QIU YUE)  
国立研究開発法人産業技術総合研究所人工知能研究センター研究員。2021年3月筑波大学大学院システム情報工学研究科博士後期課程修了(工学)、2021年10月より産業技術総合研究所人工知能研究センター研究員。言語と画像のマルチモーダルタスク・画像認識・3次元認識・動画像認識に従事
品川 政太朗 (シナガワ セイタロウ)  
奈良先端科学技術大学院大学先端科学技術研究科情報科学領域助教(本データはこの書籍が刊行された当時に掲載されていたものです)