DETR〈DEtection TRansformer〉&最新・物体検出アーキテクチャ入門 ViT/CenterNet/Pix2Seqを活用した実践ディープラーニング・プログラミング
出版社名 | 秀和システム |
---|---|
出版年月 | 2025年7月 |
ISBNコード |
978-4-7980-7406-1
(4-7980-7406-3) |
税込価格 | 4,180円 |
頁数・縦 | 795P 24cm |
商品内容
要旨 |
Transformerを用いた代表的検出モデル「DETR」を中心に、ViT(Vision Transformer)による物体領域の検出、「CenterNet」による中心点予測型の検出、言語生成型アプローチである「Pix2Seq」、さらには「RetinaNet」などのCNN系アーキテクチャまで幅広くカバー、近年の物体検出分野の主要モデルを比較・理解しながら習得できます。全編にわたり、「Keras」(一部対応)と「PyTorch」の両ライブラリに対応しており、モデルの構築、推論、可視化、バックボーン(ResNet101/152)の変更や、COCOデータセットを用いた大規模推論処理の実装までを丁寧に解説しました。画像分類のその先…「どこに、何があるのかを検出する」という実践的課題に挑むすべての人におすすめの一冊です。 |
---|---|
目次 |
1章 開発環境について |
出版社・メーカーコメント
DEtection TRansformerを活用した物体検出のための機械学習モデルについての解説書です。