- 著者: 石田 基広, 市川 太祐, 瓜生 真也, 湯谷 啓明
- 出版社: シーアンドアール研究所
- ISBN-10: 486354216X
- ISBN-13: 978-4863542167
- 発売日: 2017/3/27
- https://www.amazon.co.jp/dp/486354216X
- 正誤表 2017/03/31
章ごとにスクリプトを分けています。すべてUTF-8(Mac向け)で作成されています。 Windowsユーザーは、Windows.zip を解凍し、フォルダに生成されたファイルを利用してください。
本書では、統計解析ツール「R」を使って、膨大なウェブサイトから情報収集を行う方法(スクレイピングの手法)をわかりやすく解説しています。 HTMLやXMLの解析、APIを活用したデータ収集、データを取得した後の整形など、実践を交えながら、そのテクニックを紹介しています。