スクレーパー共有サイト「ScraperWiki」がリニューアルして凄い事に!
以前、オープンデータまで待てない人の、スクレーパー共有サイト(ScraperWiki)という記事を書きましたが、スクレーパー(クローラー)共有サイトのScraperWikiが大幅にリニューアルされていました。
データを取得するだけでなく、データの可視化、分析などまでも行えるデータサイエンスのプラットフォームとなることを目指すそうです。
ScraperWiki is a platform for doing data science on the web
We help individuals and businesses to get, clean, visualise, analyse and manage data from thousands of sources. For science, journalism, lead generation—whatever you need.
ほとんど別サービスになったため、以前のアカウントは新しいScraperWikiでは使用できず、新たにアカウントを作成する必要があります。
(ScraperWikiクラシックとして旧サービスは継続中なので、そちらでは使用できます)
目玉機能の一つである、ブラウザ上でスクレイパーをコーディングして取得したデータを共有できる機能はそのままに、データをグラフで表示したり、地図上にマッピングするなどの機能(TOOL)が追加されています。
TOOL達
SQLクエリを使ってデータを取り出せるTOOLや、取得したデータをCKANに公開するTOOLなどもあります。
グラフ表示
地図表示
データを表示するviewについては、HTMLやJavasciptを使って自ら作成することができるそうです。
そして今後導入される予定の「Xtract」機能が素晴らしいです。
今までのようにコードを記述しなくても、簡単なウィザードに沿って設定を行うだけで、簡単にデータを取得するスクレイパーを作成できるようになるそうです。
しかも、エクセルファイルやPDFファイル内のテーブルからもデータ取得が可能だとか!
これが実現したら、データ取得作業がかなり軽減されそうです。
とにかく、今後に期待大なサービスなので目が離せませんね!