オープンデータ

悪用されないように制限をかけるなら、それはオープンデータではない。

オープンデータ

オープンデータを使った社会的に問題のあるアプリが出てくる可能性もある。そうならないように、オープンデータ提供者とアプリ開発者の間でデータ利用許諾規約を明確にする必要がある。ちなみに今回のコンテストについても、東京メトロはその規約をきちんと打ち出している。

それはもうオープンデータではないです。
オープンデータハンドブックに定義が書かれています。

オープンとは?

このハンドブックで扱うのはオープンデータである。ところで、実際のところ オープン なデータとは何なのだろう? 本書では、 Open Definition の定義に従うデータをオープンデータと呼ぶことにする。

オープンデータとは、自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのことだ。従うべき決まりは、せいぜい「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である。

full Open Definition に、その意味するところの明確な説明がある。まとめると、最も大切なのはこの三点である。

  • 利用できる、そしてアクセスできる データ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロードできるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。
  • 再利用と再配布ができる データを提供するにあたって、再利用や再配布を許可しなければならない。また、他のデータセットと組み合わせて使うことも許可しなければならない。
  • 誰でも使える 誰もが利用、再利用、再配布をできなければならない。データの使い道、人種、所属団体などによる差別をしてはいけない。たとえば「非営利目的での利用に限る」などという制限をすると商用での利用を制限してしまうし「教育目的での利用に限る」などの制限も許されない。
  • データ提供者に悪用された責任を負わせる社会では、提供者はデータの利用に様々な制限をかけ、開発者はデータを利用するまでに雑多な手続きを経なければならず、それはイノベーションを阻害し生産性を低下させます。データを悪用するような人間がでてきたら、悪用した人間を都度取り締まりましょう。その方がローコストです。

    というのがオープンデータの基本方針です。

    ついでに言ったら「データに誤りがあったりバグがあったりしても、提供側は責任を取らないよ! 自己責任でよろしく! 自分で直して、なんなら修正したデータをPull Requestしてくれれば反映するよ!」というのがオープンデータです。

    ようするに、オープンソースのデータ版です。

    「データの提供側がデータがどう使われるかに責任をもたないなんてとんでもない事だ。絶対に許せん!」という考え方もアリですが、だったらそれはもうオープンではないので「オープンデータ」という用語を使うのはやめましょう。

    アクセスに条件を付けるような使用規約などという言葉は使うべきではない。使用規約は、本来オープンなはずのファイルへのアクセスを規制するズルイやり方だ。素晴らしい公共リソースになりたいのなら、そんな態度は避けるべきだ。

    追記