Vision Transformer入門 新しいコンピュータビジョンの世界
Computer Vision Library
出版社名 | 技術評論社 |
---|---|
出版年月 | 2022年9月 |
ISBNコード |
978-4-297-13058-9
(4-297-13058-0) |
税込価格 | 3,520円 |
頁数・縦 | 263P 23cm |
商品内容
目次 |
第1章 TransformerからVision Transformerへの進化 |
---|
出版社・メーカーコメント
自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。目次1章 TransformerからViTへの進化2章 Vision Transformerの基礎と実装3章 実験と可視化によるViTの探求4章 コンピュータビジョンへの応用5章 Vision and Languageへの応用6章 ViTの派生手法7章 Transformerの謎を読み解く8章 Vision Transformerの謎を読み解く