• 本

スケーラブルデータサイエンス データエンジニアのための実践Google Cloud Platform

出版社名 翔泳社
出版年月 2019年6月
ISBNコード 978-4-7981-5883-9
4-7981-5883-6
税込価格 4,180円
頁数・縦 390P 23cm

商品内容

目次

データに基づくより良い意思決定
クラウドへのデータの取り込み
魅力的なダッシュボードを作成する
ストリーミング・データ処理
インタラクティブなデータ探索
Cloud Dataprocによるベイズ分類器
Sparkによるロジスティック回帰分析
スライディングウィンドウによる集計処理
TensorFlowを用いた分類モデル
リアルタイム機械学習
付録A 機械学習データセット内の機密データに関する考慮事項

出版社・メーカーコメント

「膨大なデータを分析して傾向を探り意思決定に援用する」とはよく耳にするフレーズですが、「膨大なデータ」から「援用する」までの間に、どのようなことがなされているのでしょうか。その各段階における必要な知識や技能やツールやインフラにはなにがあるのでしょうか。本書はそういった疑問を、身近な例(フライトスケジュールからミーティングの参加・不参加確定)から説き起こします。とはいえ、それは単に米国運輸省のデータをダウンロードし、フライトの傾向を時間軸に合わせて分析し、スケジュールとして提示する、という“シンプル”なストーリーではありません。「データ分析を実行してビジネスで成果を出す」ことができる人を「データエンジニア」と呼ぶ、Googleならではの文化が色濃く出た1冊です。すなわち、クエリの構築やレポート、グラフ化が最終目標ではなく、それらをひっくるめたスケーラブルで反復可能なシステムを構築できる人材への足がかりとなる1冊であり、肩書としての「データサイエンティスト」から、真に求められているデータサイエンティストへと、自身をスケールしていくための手引書です。

著者紹介

ラクシュマナン,バリアッパ (ラクシュマナン,バリアッパ)   Lakshmanan,Valliappa
Google Cloudのプロフェッショナルサービス部門でデータ分析と機械学習の技術リーダーを務めている。Google入社前は、Climate Corporationでデータサイエンティストのチームを率いていた。また、NOAA National Severe Storms Laboratoryでリサーチサイエンティストを務め、悪天候の診断と予測のための機械学習アプリケーションの開発に取り組んでいた(本データはこの書籍が刊行された当時に掲載されていたものです)