Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒ入門　新しいコンピュータビジョンの世界/片岡裕雄／監修　山本晋太郎／著　徳永匡臣／著　箕浦大晃／著　邱【ゲツ】／著　品川政太朗／著本・コミック：オンライン書店e-hon

Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒ入門　新しいコンピュータビジョンの世界

Ｃｏｍｐｕｔｅｒ　Ｖｉｓｉｏｎ　Ｌｉｂｒａｒｙ

片岡裕雄／監修　山本晋太郎／著　徳永匡臣／著　箕浦大晃／著　邱【ゲツ】／著　品川政太朗／著

出版社名	技術評論社
出版年月	2022年9月
ISBNコード	978-4-297-13058-9 （4-297-13058-0）
税込価格	3,520円
頁数・縦	２６３Ｐ　２３ｃｍ

商品内容

目次	第１章　ＴｒａｎｓｆｏｒｍｅｒからＶｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒへの進化第２章　Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの基礎と実装第３章　実験と可視化によるＶｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの探求第４章　コンピュータビジョンへの応用第５章　Ｖｉｓｉｏｎ　ａｎｄ　Ｌａｎｇｕａｇｅへの応用第６章　Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの派生手法第７章　Ｔｒａｎｓｆｏｒｍｅｒの謎を読み解く第８章　Ｖｉｓｉｏｎ　Ｔｒａｎｓｆｏｒｍｅｒの謎を読み解く

出版社・メーカーコメント

自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer（ViT）です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。目次1章 TransformerからViTへの進化2章 Vision Transformerの基礎と実装3章実験と可視化によるViTの探求4章コンピュータビジョンへの応用5章 Vision and Languageへの応用6章 ViTの派生手法7章 Transformerの謎を読み解く8章 Vision Transformerの謎を読み解く

著者紹介

片岡　裕雄 (カタオカ　ヒロカツ)　　: 国立研究開発法人産業技術総合研究所人工知能研究センター主任研究員。２０１４年慶應義塾大学大学院理工学研究科後期博士課程修了、博士（工学）。２０２０年１０月より国立研究開発法人産業技術総合研究所主任研究員。画像認識、動画解析、人物行動解析に従事。２０１１／２０２０年ＶＩＥＷ小田原賞、２０１９年度産総研論文賞、ＡＣＣＶ　２０２０　ＢＥＳＴ　ＰＡＰＥＲ　ＨＯＮＯＲＡＢＬＥ　ＭＥＮＴＩＯＮ　ＡＷＡＲＤ受賞

山本　晋太郎 (ヤマモト　シンタロウ)　　: ２０２２年３月に早稲田大学先進理工学研究科物理学及応用物理学専攻にて博士後期課程を修了し、博士（工学）を取得。学生時代は主にコンピュータビジョンと自然言語処理の分野の研究に従事。博士論文のテーマは、効率的な研究コミュニケーションのための科学論文解析。現在は企業の研究開発部門に勤める会社員

徳永　匡臣 (トクナガ　マサオミ)　　: 株式会社野村総合研究所ＡＩソリューション推進部ＡＩ　ｔｅｃｈ　ｌａｂ．所属。２０１９年３月、東北大学工学部を卒業。２０２１年３月、東京工業大学大学院情報理工学院情報工学系知能情報コースにて修士課程を修了。現在は、コンピュータビジョンおよび自然言語処理の業務に従事

箕浦　大晃 (ミノウラ　ヒロアキ)　　: 中部大学大学院工学研究科情報工学専攻博士後期課程３年。２０２０年中部大学大学院博士前期課程情報工学専攻修了。同大学大学院博士後期課程情報工学専攻在学中。コンピュータビジョン、パターン認識の研究に従事

ＱＩＵ　ＹＵＥ (ＱＩＵ　ＹＵＥ)　　: 国立研究開発法人産業技術総合研究所人工知能研究センター研究員。２０２１年３月筑波大学大学院システム情報工学研究科博士後期課程修了（工学）、２０２１年１０月より産業技術総合研究所人工知能研究センター研究員。言語と画像のマルチモーダルタスク・画像認識・３次元認識・動画像認識に従事

品川　政太朗 (シナガワ　セイタロウ)　　: 奈良先端科学技術大学院大学先端科学技術研究科情報科学領域助教（本データはこの書籍が刊行された当時に掲載されていたものです）