• 本

大規模データのマイニング

出版社名 共立出版
出版年月 2014年7月
ISBNコード 978-4-320-12375-5
4-320-12375-1
税込価格 6,050円
頁数・縦 354P 27cm

商品内容

目次

1 データマイニング
2 大規模ファイルシステムとマップレデュース
3 類似したアイテムを探す
4 データストリームのマイニング
5 リンク解析
6 頻出アイテムセット
7 クラスタリング
8 ウェブ上での宣伝
9 推薦システム

出版社
商品紹介

大規模データに対して使えるデータマイニングの重要で実用的なアルゴリズムをデータベースやウェブ技術の分野で著名な原著者が解説。

出版社・メーカーコメント

ウェブやインターネットコマースの隆盛によって,とてつもなく巨大なデータセットが出現し,そして,データマイニングによってそれらから情報が抽出されている。巨大なデータに対するマイニングにおいては,従来から知られているアルゴリズムがそのままでは機能しないことが多い。巨大なデータを扱う上でこれまでとは違った処理戦略や技法が必要となる。本書はデータマイニングにおいて重要な問題の解決に使われてきており,さらに巨大なデータセットに対しても使用できる実用的なアルゴリズムを,データベースやウェブ技術の分野で著名な原著者が解説する。まず,データマイニングの本質や,データマイニングがどのように扱われているかを概観する。次に,今後非常に大量のデータの解析を行う際に,クラウドコンピューティングとともに重要視されると考えられ,この後の章の議論に必須のものとなるマップレデュースを解説する。その後,類似するアイテムの検索で用いられるシングリング,ミンハッシュや局所性鋭敏型ハッシュ(LSH)を説明する。その次に,すぐに反応しないと消えてしまう,ストリーム形式のデータについて考え,そのあとで検索エンジンに用いられているPageRankという計算手法を扱う。それ以降では,頻出するアイテムセットやクラスターを見つける問題を扱い,最後には,現在のオンライン商店の活動で必須の,推薦システムとオンライン広告という,二つの話題を扱う。全体として初心者にもわかりやすく詳説されており,大規模なデータに立ち向かう学生のみならず,データサイエンティストを始めとした実務家にも必携の書となろう。

著者紹介

岩野 和生 (イワノ カズオ)  
1975年、東京大学理学部数学科卒業。1987年、米国プリンストン大学コンピューターサイエンス学科Ph.D.取得。1975年から2012年まで、日本アイ・ビー・エム株式会社、2012年より三菱商事株式会社勤務
浦本 直彦 (ウラモト ナオヒコ)  
1990年、九州大学卒業。同年より日本アイ・ビー・エム(株)東京基礎研究所勤務。2000年、九州大学より博士(工学)取得。2000‐2005年、国立情報学研究所客員助教授兼務。現在、情報セキュリティ大学院大学連携教授を兼務している(本データはこの書籍が刊行された当時に掲載されていたものです)