• 本

Pythonではじめる教師なし学習 機械学習の可能性を広げるラベルなしデータの利用

出版社名 オライリー・ジャパン
出版年月 2020年4月
ISBNコード 978-4-87311-910-6
4-87311-910-3
税込価格 3,960円
頁数・縦 317P 24cm

商品内容

要旨

教師なし学習はラベル付けされていないデータから学習する機械学習の一種です。現在の機械学習では大量のラベル付きのデータを用いる教師あり学習が主流ですが、ラベルを付けるには膨大なコストがかかります。現実世界に機械学習を適用していくためには、ラベル付けを必要としない教師なし学習の重要性が増してくると考えられます。本書は実践的な視点から、データにある隠れたパターンを特定し、異常検出や特徴量抽出・選択を行う方法を紹介します。ラベルなしデータを有効に利用することで、機械学習の可能性を各段に広げる教師なし学習の本質に迫ります。さらに、変分オートエンコーダ(VAE)や敵対的生成ネットワーク(GAN)、制限付きボルツマンマシン(RBM)などの生成モデルも紹介します。

目次

1部 教師なし学習の基礎(機械学習エコシステムにおける教師なし学習の立ち位置
機械学習プロジェクトのはじめから終わりまで)
2部 scikit‐learnを用いた教師なし学習(次元削減
異常検出 ほか)
3部 TensorFlowとKerasを用いた教師なし学習(オートエンコーダ
オートエンコーダハンズオン ほか)
4部 TensorFlowとKerasを用いた深層教師なし学習(制限付きボルツマンマシンを用いた推薦システム
深層信念ネットワークを用いた特徴量検出 ほか)

おすすめコメント

機械学習の手法の1つ、教師なし学習に絞って解説した実践書! 教師なし学習は、大きく3つに分類される機械学習の手法のうちの1つ。従来は、教師あり学習が主流でしたが、これからのデータ分析の形を考えると、教師なし学習も大きな一角を占めていくと考えられています。本書では、実践的な視点で、データ内に隠れている見つけにくいパターンを特定し、異常を検出し、自動的に特徴量抽出と選択を行っていきます。さらには、異なる機械学習手法の長所と短所を比較し、データに最適な手法の選び方についても、示していきます。

著者紹介

ペイテル,アンクール・A. (ペイテル,アンクールA.)   Patel,Ankur A.
Vista Equity Partnersのポートフォリオ企業である7Park Dataのデータサイエンス担当副社長。7Park Dataでは、代替データを使用して、ヘッジファンドや企業向けのデータ製品を構築し、エンタープライズクライアント向けの機械学習サービス(MLaaS)を開発している。MLaaSには、自然言語処理(NLP)、異常検出、クラスタリング、時系列予測が含まれる。7Park Dataの前は、ニューヨーク市にあるイスラエルの人工知能会社ThetaRayでデータサイエンスを行っていた。ThetaRayは、教師なし学習の応用におけるリーディングカンパニー。JPモルガンのアナリストとしてキャリアをスタートし、その後、世界最大のグローバルマクロヘッジファンドであるブリッジウォーターアソシエイツの新興市場トレーダーとなり、後に機械学習ベースのヘッジファンドであるR−Squared Macroを設立、運営を5年間にわたり行う。プリンストン大学のウッドロー・ウィルソン・スクール卒業。現在、ニューヨーク市のトライベッカ在住。世界中を旅している
中田 秀基 (ナカダ ヒデモト)  
博士(工学)。産業技術総合研究所において分散並列計算、機械学習システムの研究に従事。筑波大学連携大学院教授。極真空手初段(本データはこの書籍が刊行された当時に掲載されていたものです)