• 本

エンジニアのためのデータ分析基盤入門 データ活用を促進する!プラットフォーム&データ品質の考え方 基本編

改訂新版

Tech×Books plus

出版社名 技術評論社
出版年月 2024年11月
ISBNコード 978-4-297-14563-7
4-297-14563-4
税込価格 3,300円
頁数・縦 349P 24cm
シリーズ名 〈エンジニアのための〉データ分析基盤入門

商品内容

要旨

大規模データ&データベースの技術基礎。押さえておきたい主要技術スタック。分析環境のセルフサービス。SSoT(Single Source of Truth)。データ管理のためのメタデータ。データの精度を高めるデータ品質の確保。自由に、素早く、反復作成できるデータマート。事例でわかるアーキテクチャ設計の基本フロー。データドリブンを促進するデータ分析基盤の運用指針。大幅増補システム&データ整備の基本をこの1冊で!

目次

第0章 “速習”データ分析基盤と周辺知識―データ分析基盤入門プロローグ
第1章 “入門”データ分析基盤―データ分析基盤を取り巻く「人」「技術」「環境」
第2章 データエンジニアリングの基礎知識―4つのレイヤー
第3章 データ分析基盤の管理&構築―セルフサービス、SSoT、タグ、ゾーン、メタデータ管理
第4章 データ分析基盤の技術スタック―データソースからアクセスレイヤー、クラスター、ワークフローエンジンまで
第5章 メタデータ管理―データを管理する「データ」の重要性
第6章 データマート&データウェアハウスとデータ整備―DIKWモデル、データ設計、スキーマ設計、最小限のルール
第7章 データ品質管理―質の高いデータを提供する
第8章 データ分析基盤から始まるデータドリブン―データ分析基盤の可視化&測定
第9章 “事例で考える”データ分析基盤のアーキテクチャ設計―豊富な知識と柔軟な思考で最適解を目指そう
Appendix “ビッグデータでも役立つ”RDB基礎講座

著者紹介

斎藤 友樹 (サイトウ ユウキ)  
SIerで官公庁、年金、広告などのシステムの要件定義〜保守運用まで、SEやマネージャーとしてフロントエンド〜サーバーサイドまでひととおり経験。現在は、事業会社にてビッグデータ分析に関するシステムの構築、蓄積したデータの活用を行う仕事に従事している。直近では利用者が数千万を超える環境で、ストリーミングデータの処理や一日あたり5000超のETLジョブを捌くデータ分析基盤のアーキテクチャ設計やデータ活用のためのしくみ作りを担当。また、AWSなどのパブリッククラウドイベントの登壇などを通して積極的に情報発信を行っている(本データはこの書籍が刊行された当時に掲載されていたものです)