• 本

統計的データクリーニングの理論と実践 Rによるデータ編集/欠測補完システム

出版社名 共立出版
出版年月 2022年2月
ISBNコード 978-4-320-11463-0
4-320-11463-9
税込価格 6,380円
頁数・縦 350P 26cm

商品内容

要旨

本書は、数値データやカテゴリデータ、文字列や日付といった様々なタイプのデータを含むファイルをクリーンにするために、公的統計の分野で長年培われてきた技術と理論を幅広くまとめ、汎用的なデータクリーニングシステムをRで構築する方法を紹介する書籍です。Rにおけるデータ表現やデータ構造に関連する技術面についても詳しく解説するとともに、個別のデータ項目に関する知識に基づくルールを用いて統計的にデータを検証し、複数の項目が絡むエラーがある場合に修正すべき最小限の項目を特定し、修正あるいは欠測の補完を行うための様々な方法論も説明しています。

目次

第1章 データクリーニング
第2章 R入門
第3章 データの技術的な表現
第4章 データ構造
第5章 テキストデータのクリーニング
第6章 データ検証
第7章 データレコード内のエラー局所化
第8章 ルール集合のメンテナンスと単純化
第9章 ドメイン知識のためのモデルベースの方法
第10章 補完と調整
第11章 事例:小規模なデータクリーニングシステム

著者紹介

van der Loo,Mark (VAN DER LOO,MARK)   van der Loo,Mark
オランダ統計局統計的方法論部門(Department of Statistical Methods)所属
de Jonge,Edwin (DE JONGE,EDWIN)   de Jonge,Edwin
オランダ統計局統計的方法論部門(Department of Statistical Methods)所属
地道 正行 (ジミチ マサユキ)  
大阪大学大学院基礎工学研究科博士前期課程修了。博士(学術)。現在、関西学院大学商学部教授。専門:数理統計学、探索的データ解析
〓橋 雅夫 (タカハシ マサオ)  
筑波大学大学院システム情報工学研究科博士後期課程修了。博士(工学)。現在、長野大学企業情報学部教授。専門:統計(公的統計)、データサイエンス
藤野 友和 (フジノ トモカズ)  
岡山大学大学院自然科学研究科博士後期課程修了。博士(理学)。現在、福岡女子大学国際文理学部准教授。専門:計算機統計学
安川 武彦 (ヤスカワ タケヒコ)  
筑波大学大学院ビジネス科学研究科博士課程修了。博士(経済学)
和田 かず美 (ワダ カズミ)  
筑波大学大学院企業科学専攻システムズ・マネジメントコース満期退学。経営学修士(MBA)(本データはこの書籍が刊行された当時に掲載されていたものです)