大規模データのマイニング
出版社名 | 共立出版 |
---|---|
出版年月 | 2014年7月 |
ISBNコード |
978-4-320-12375-5
(4-320-12375-1) |
税込価格 | 6,050円 |
頁数・縦 | 354P 27cm |
商品内容
目次 |
1 データマイニング |
---|---|
出版社 商品紹介 |
大規模データに対して使えるデータマイニングの重要で実用的なアルゴリズムをデータベースやウェブ技術の分野で著名な原著者が解説。 |
出版社・メーカーコメント
ウェブやインターネットコマースの隆盛によって,とてつもなく巨大なデータセットが出現し,そして,データマイニングによってそれらから情報が抽出されている。巨大なデータに対するマイニングにおいては,従来から知られているアルゴリズムがそのままでは機能しないことが多い。巨大なデータを扱う上でこれまでとは違った処理戦略や技法が必要となる。本書はデータマイニングにおいて重要な問題の解決に使われてきており,さらに巨大なデータセットに対しても使用できる実用的なアルゴリズムを,データベースやウェブ技術の分野で著名な原著者が解説する。まず,データマイニングの本質や,データマイニングがどのように扱われているかを概観する。次に,今後非常に大量のデータの解析を行う際に,クラウドコンピューティングとともに重要視されると考えられ,この後の章の議論に必須のものとなるマップレデュースを解説する。その後,類似するアイテムの検索で用いられるシングリング,ミンハッシュや局所性鋭敏型ハッシュ(LSH)を説明する。その次に,すぐに反応しないと消えてしまう,ストリーム形式のデータについて考え,そのあとで検索エンジンに用いられているPageRankという計算手法を扱う。それ以降では,頻出するアイテムセットやクラスターを見つける問題を扱い,最後には,現在のオンライン商店の活動で必須の,推薦システムとオンライン広告という,二つの話題を扱う。全体として初心者にもわかりやすく詳説されており,大規模なデータに立ち向かう学生のみならず,データサイエンティストを始めとした実務家にも必携の書となろう。