• 本

大規模言語モデル入門

出版社名 技術評論社
出版年月 2023年8月
ISBNコード 978-4-297-13633-8
4-297-13633-3
税込価格 3,520円
頁数・縦 321P 23cm
シリーズ名 大規模言語モデル入門

商品内容

要旨

コンピュータが言語を理解するしくみ。

目次

第1章 はじめに
第2章 Transformer
第3章 大規模言語モデルの基礎
第4章 大規模言語モデルの進展
第5章 大規模言語モデルのファインチューニング
第6章 固有表現認識
第7章 要約生成
第8章 文埋め込み
第9章 質問応答

著者紹介

山田 育矢 (ヤマダ イクヤ)  
株式会社Studio Ousia代表取締役チーフサイエンティスト・理化学研究所革新知能統合研究センター客員研究員。2007年にStudio Ousiaを創業し、自然言語処理の技術開発に従事。2016年3月に慶應義塾大学大学院政策・メディア研究科博士後期課程を修了し、博士(学術)を取得。大規模言語モデルLUKEの開発者
鈴木 正敏 (スズキ マサトシ)  
株式会社Studio Ousiaソフトウェアエンジニア・東北大学データ駆動科学・AI教育研究センター学術研究員。2021年3月に東北大学大学院情報科学研究科博士後期課程を修了し、博士(情報科学)を取得。博士課程では質問応答の研究に従事。日本語質問応答のコンペティション「AI王」の実行委員。東北大学が公開している日本語BERTの開発者
山田 康輔 (ヤマダ コウスケ)  
株式会社Studio Ousiaリサーチエンジニア・名古屋大学大学院情報学研究科博士後期課程3年。2021年3月名古屋大学大学院情報学研究科博士前期課程修了。2022年4月より日本学術振興会特別研究員(DC2)。自然言語処理、特にフレーム意味論に関する研究に従事
李 凌寒 (リ リョウカン)  
LINE株式会社(2023年10月よりLINEヤフー株式会社)自然言語処理エンジニア。2023年3月に東京大学大学院情報理工学系研究科博士後期課程を修了し、博士(情報理工学)を取得。博士課程では言語モデルの解析や多言語応用の研究に従事。大規模言語モデルmLUKEの開発者(本データはこの書籍が刊行された当時に掲載されていたものです)