PythonによるWebスクレイピング
第3版
出版社名 | オライリー・ジャパン |
---|---|
出版年月 | 2025年6月 |
ISBNコード |
978-4-8144-0122-2
(4-8144-0122-1) |
税込価格 | 3,960円 |
頁数・縦 | 333P 24cm |
シリーズ名 | PythonによるWebスクレイピング |
商品内容
要旨 |
Webスクレイピングとは、インターネットからデータを機械的に集め、必要な情報を抽出する技術のことです。2019年の第2版発刊から約5年が経過し、生成AIの台頭で情報を得る方法も大きく変わりましたが、本当に欲しい情報を正しくピンポイントで得るためには、依然としてWebスクレイピングについての知識とスキルが必要です。本書では、インターネット上の膨大な情報の中から、生成AIや検索エンジンだけでは集められない本当に必要な正しい情報を入手する方法を、基礎からていねいに解説し、データの抽出、格納、収集後のクリーニング、さらにはJavaScriptの実行、OCRを含めた自然言語処理、並列処理などの高度なトピックもカバー。プログラミングテクニックとテクノロジー全般だけでなく、法律面の解説も加え、問題に遭遇した際の対処法まで紹介します。 |
---|---|
目次 |
1部 スクレイパーの作成(インターネットの仕組み |
出版社・メーカーコメント
Webスクレイピングについての深い知識と広いテクニックで本当に欲しい情報を確実に取得する!2019年の第2版発刊から約5年が経過し、生成AIの台頭で情報を得る方法も大きく変わりましたが、本当に欲しい情報を正しくピンポイントで得るためには、依然としてWebスクレイピングについての知識とスキルが必要です。本書では、インターネット上の膨大な情報の中から、生成AIや検索エンジンだけでは入手できない本当に必要な情報を入手する方法を、基礎からていねいに解説し、データの抽出、データの格納、データ収集後のクリーニング、さらには、JavaScript実行、OCRを含めた自然言語処理、並列処理などの高度なトピックに加えて法律面の解説など、プログラミングテクニックとテクノロジー全般だけでなく、問題に遭遇した際の対処法まで紹介します。