• 本

Rユーザのためのtidymodels〈実践〉入門 モダンな統計・機械学習モデリングの世界

出版社名 技術評論社
出版年月 2023年1月
ISBNコード 978-4-297-13236-1
4-297-13236-2
税込価格 2,992円
頁数・縦 199P 23cm

商品内容

目次

第1章 データの準備
第2章 回帰モデルの作成
第3章 分類モデルの作成
第4章 モデルの運用
第5章 ハイパーパラメータチューニング
第6章 自然言語処理におけるtidymodels実践

出版社・メーカーコメント

Rには多くの分析手法を実行するパッケージが提供されていますが、同じ用途であってもパッケージごとに関数の記法が違ったり、データの入力形式や出力形式が違ったりするため、データの前処理やモデルの評価といった工程におけるコーディングは、意識しなければバラバラになってしまいます。また、これが原因でスムーズな分析パイプラインを作成できず、分析環境で行ったモデリングを本番システムへ移行することを考えると、その保守は困難を極めます。これらの問題を解消するために開発され、統一的なインターフェースを提供するのがtidymodelsです。データ整形における同様のコーディングの問題を解決するためのパッケージ群で知られるtidyverseのプロジェクトの1つとして注目を浴びています。データ分析の工程には、データ準備、モデルの作成、モデルの評価、モデルの改善、モデルの運用といった一連の工程があります。本書ではそれぞれの工程をtidymodelsパッケージ群で行う方法について解説します。tidymodelsパッケージ群を利用することで、スムーズなデータ分析パイプラインを効率的に構築できるようになるでしょう。

著者紹介

松村 優哉 (マツムラ ユウヤ)  
ノバセル株式会社データサイエンティスト。慶應義塾大学大学院で経済学修士を取得。HR系企業でデータサイエンティスト・データエンジニアとして分析組織の立ち上げ経験を経て、2022年2月より現職。データサイエンス技術を用いた応用分析を得意とし、「Tokyo.R」や「Music×Analytics Meetup」などのデータ分析に関わるコミュニティ運営にも勢力的に取り組む
瓜生 真也 (ウリュウ シンヤ)  
徳島大学デザイン型AI教育研究センター助教。横浜国立大学大学院にて森林生態学を専攻。企業、研究機関でのデータエンジニアとしての経験を経て、2021年10月より現職。地理空間データの分析を研究題材とし、データサイエンス・AI教育や大学業務のDX化に取り組む
吉村 広志 (ヨシムラ ヒロシ)  
AIコンサルティングやAIソリューションの提供会社でAIエンジニアとして勤務。芝浦工業大学大学院を修了。大学時代は創薬化学の研究に取り組み、科学的根拠に基づく医薬品の効果検証に興味を持つ。卒業後は独学で数理統計学を学び、製造業の会社でAIを活用したプロジェクトを担当しデータ収集から機械学習モデルの構築と生産ラインへの実装まで経験する。AIに対する理解度向上のための人材育成企画やAI開発のナレッジ管理の仕組みを導入展開する業務も行う。その後、AIの研究開発を行う企業で幅広い分野のAI活用プロジェクトを経験。分析にはR言語を好み、R言語のコミュニティ等で情報発信活動を行っている(本データはこの書籍が刊行された当時に掲載されていたものです)