データの公開について行政に望むこと

ダッシュボードを作るならデータも公開してくれたらいいのに

行政がダッシュボードという形でデータを公開する事例が増えてきた。

見かける度に「ダッシュボードを作るにはデータを集めるだけでなく整備した上で使っているのだから、同時にデータも公開してくれたらいいのに」と思っている。

本記事では、集計前データを公開して欲しい理由と、データについて行政に望むことについて書く。

ダッシュボードとは「データ」の一部

本記事ではダッシュボードに表示するために使われているデータを「集計前データ」と表記する。

実のところ「意思決定のための情報(インテリジェンス)を作る材料であるデータ」という区分で考えるとダッシュボード(の大半)もダッシュボードで使われている集計前のデータも同じ「データ」に分類される。

「データ」と「ダッシュボード」と表記してしまうと別のものようにとらえてしまう危険があるので、それを避けるために「集計前データ」という言葉を使うことにする。実際には生データではないため集計もされていたりするが、最終的にダッシュボードで集計されることが多いので”集計前”と呼ぶことにした。

なお、「データ」と「インテリジェンス」の違いについては「情報」には「データ」と「インテリジェンス」があるに書いた。

ダッシュボードだけではできないこと

なぜ集計前データも一緒に公開して欲しいのかというと、ダッシュボードだけでは以下のようなことができないからだ。

  • 重要なグラフを先頭において目立たせる

  • 主要な項目だけに絞って他を消す

  • 不要な表やグラフは表示させないようにする

  • 他のデータと組み合わせて1つのダッシュボードを作る

  • 表示が軽くなる環境で作り直す

データの使い方も見せ方も人それぞれなのに、ダッシュボードとして公開されている状態でしか使えないのは不便だ。

集計前データがあればダッシュボードは作れるが、逆は難しい

ダッシュボードからダウンロードができる場合もある。しかし、集計された状態からでは集計前の状態が復元できないので、より細かく集計を行いたいと思ってもできなくなってしまう。

例えば、市町村区ごとの年齢性別ごとの人口があれば、県や全国の年齢、年代、性年代別を作ることができる。一方、日本の人口しかわからなければ細かい集計はできない。極端なことを言えば、世帯ごとの男女別の人数がわかればどんな人口に関する統計でもあとは作れる。

車輪の再発明がおこなわれる

ダッシュボードで公開されている数値を別のデータと組み合わせたり、集計前データを使ってより深堀したいと思っても集計前データがなければ自力で集める必要がある。大まかに考えても以下の課題がある。

  • データが入手できるかを調べる

  • 入手のためにコストや申請の手間がかかる

  • 入手できても使えるようにするためにデータをきれいにする必要がある

  • データを保管しておく必要がある

これらの課題はそれそれが大変な課題である。しかも、使いたいと思った人や企業それぞれが独自に同じことを行っている。結果、膨大な時間や機会が無駄に失われている。

ダッシュボードとして公開しているのであればすでにこれらのことは行っているはずだ。集計前データが公開されれば集計と分析に集中することができる。

データの利便性のために、ダッシュボードと集計前データの両方を公開してほしい

以上のことから、ダッシュボードと一緒に集計前データも公開してほしい。

そして、集計前データはきれいに整理されておりそのまま使えて、できる限り細かい粒度で、様々な環境ですぐ取り込めて使えるように複数の形式で提供されるとうれしい。メタデータも充実していればなおありがたい。

ダッシュボードになっていれば慣れていない人が触りやすいのはたしかだし、データの使い方の1つとして自分達はこのように使っている、という参考例としてダッシュボードを提供することには意義があると思う。

一方で、データの扱いに慣れている人にとっては自由にデータを取捨選択したり組み合わせたりができないのはもどかしい。

集計前のデータの公開がない状態ではせっかくのデータもその価値は半分どころか数分の一になってしまうこともあるだろう。それはとてももったいないと思う。

データ整備こそ行政にリードしてほしい

すでに様々なデータが提供されてはいることは承知しているが、データを個々の企業が使おうとして整備しても、それを誰でも使っていいと公開するモチベーションがない。

なので、特に政府統計といった、国民に広く使われることが想定されるデータをきれいにした上で統一された形式で公開し、更新し続けるのは行政にしかできないことではないだろうか。

「データ」はダッシュボードとしてカジュアルにデータを使うことができる環境と、利用者が取捨選択して自由に使うことができるようにきれいにされたデータの両方の提供が必要である。そして、このためのデータ整備こそ行政にリードしてほしいことなのだ。

この記事が気に入ったらサポートをしてみませんか?