見出し画像

米国連邦政府のオープンデータの特徴

仕事柄、日本のデジタル庁関連のニュースはなるべく追うようにしているが、見ていると少し気になる点がある。デジタルガバメントを推進するうえで、長年の課題だった人材確保と内製に意欲的であることや、まずは国民のユーザビリティを重視した成果にフォーカスしようとしていることは、本質的な課題を見抜く力と戦術的な優先度設定の正しさという点でスジが良い方針だと感じる。

一方で、現政権のデジタル庁構想において、あえてスルーしようとしているな、と感じられるポイントもある。それがオープンガバメント(情報保全・情報公開)である。政府がデジタル化を進めるということは、国民の経済活動や健康医療に関する多くのデータを政府が保持し、管理するという傾向を否応なく強化する。そのため、政府に対する国民の信頼性がないとどこかで大きな抵抗を受けることになる。行政手続きに関する情報を記録し、政策の決定プロセス、施策の評価、財政、教育、環境、治安に関するデータを正確に国民に公開するという透明性が、デジタルガバメントの重要な柱なのはそのためである。

いわばオープンガバメントというのは、デジタルガバメントを成功させるための前提条件、あるいは二つで一つの取り組みと言ってよいと思うが、報道を追う限り、あまりオープンガバメントがキーワードとしてフォーカスされている様子がない。ここがスルーされようとしているのでは、という自分と同じ懸念を感じる人もいるようだ。たとえば、TERRANETの寺嶋一郎氏は次のように言う。

ただ何点か注文をつけおきたい。1つは政府の透明性だ。デジタルガバメントの実現には、マイナンバーカードの普及が不可欠だ。それは政府への信頼があってこそ可能なのだ。国に個人情報が筒抜けになることへの不安を払拭できない限り、マイナンバーカードを使う気にはなれない人も多いのだろう。電子政府で有名なエストニアがデジタル化に成功したのは、情報を包み隠さずに知らせる政府に国民の信頼が寄せられているからだという。

高知大学准教授の塩原俊彦氏も、現政権の構想に透明性の観点が欠けていることを指摘する。

デジタル化は情報開示しやすい環境づくりがあってはじめて包括的な行政サービスを可能とするであり、政府にとって不都合な情報を隠して、ごく一部だけをデジタル化しても、それは政府の説明責任を果たすことにつながらない。

両氏の意見には筆者も同感で、やはり同じ不安を感じる人がいるのだな、と思う。最近、日本でデジタルガバメントの先進的取り組みとして注目されるのは、台湾やエストニアの事例が多いようだが、米国もまた日本政府がベンチマークとする国の一つであり、米国はオープンガバメントに極めて積極的である。以下、備忘録も兼ねていくつか取り組みを紹介したい。

米国のオープンガバメント

米国のオープンガバメントは、オバマ政権時代にITとウェブを活用して本格的に開始された。2009年、データカタログサイトData.govが開設された。連邦政府自身が持つデータのほか、州政府や地方都市が公開するデータを掲載する巨大なカタログサイトである。現在では197,474のデータセットが公開されている(2020年10月時点)。

データの多くはCSVやJSONなど静的ファイルとして提供されているが、技術的に注目すべき点として、API化が進展していることがある。データがAPIで入手できることのメリットは、大きく以下の二つがある。

M2M:人手を介さず直接データをソフトウェアにインプットできるため、素早くデータ処理出来る。データ仕様の変更に対しても改修が簡単になる。これは、連邦政府が現在取り組んでいるFERMIというペーパーレス・イニシアティブにも後押しされている。連邦政府は2022年までに一時的・恒久的問わずあらゆるデータを電子フォーマットで管理することを目指しており、必然的にあらゆるデータはサービス間をAPIで流れることになる。

Visualization:その結果、可視化ツールにシームレスに連携することができ、よりリアルタイムかつインタラクティブにデータを示せる。(なんとなくTableauがよく使われている気がする)

日本政府も、総務省統計局のe-Statのサイトでグラフによる可視化やAPIデータ公開も行われているが、各省庁が独自に公開しているデータについては、PDFで提供されるためスクレイピングの手間が発生したり、フォーマット仕様がコロコロ変わるので、集計処理の自動化を阻害するという問題がある。

米国のオープンデータの好例

こうした技術的特徴のほか、米国のオープンデータを見て驚くのが、粒度の細かさとフォーマットの統一性である。日本政府が公開するデータの多くは、人口動態、失業率、消費者物価指数などマクロな統計データが多い。これはもちろん、研究者や企業にとって有益なデータだとは思うが、一般国民が日常生活の中で利用できるデータではない。これに対して、米国のオープンデータは犯罪や教育に関して、地域や学区といった非常に細かいメッシュのデータを、一律のデータフォーマットで提供している。たとえば以下のようなものがある。

FBI - Crime Data Explorer 

FBIは1930年から80年以上にわたって地域別の犯罪統計のデータを収集するUCRというプログラムを実施している。そのデータを可視化したサイト。

殺人、レイプ、強盗といった犯罪別の発生件数や人口当たりの発生率などの推移を経年でトラッキングすることができる。警察にしてみれば不名誉な情報も多いと思うが、それでも公開しようという気迫を感じる。これが出来るのはFBIという連邦政府直属の全国をカバーする警察機構の存在も大きいのだと思われる。

画像1

日本でも各県警が犯罪統計のデータは公開していることが多いが、インタラクティブなマップやグラフになっている場合もあれば、PDFなど静的ファイルで提供されていたり、粒度とデータフォーマットはバラバラである。使い勝手はお世辞にも統一されていない。


CCD - Common Core of Data

教育省が管轄する公立学校に関する基礎データが閲覧できるサイト。学区に属する生徒の人種構成、話す言語、卒業後の進学率、障害を抱える子ども、親の収入の平均、健康保険の加入状況、片親の子どもの比率、フードスタンプの受給率など公教育のパフォーマンスに関連する情報が詳細に公開されている。これもまた、学校 ―― 特に貧困層の多い「荒れている」学校 ―― にとって決して名誉な情報ばかりではない。しかし、それでもまずは事実を公開することが重要なのだという信念を感じる。CCDの理念の一つは「Empower Parents」である。すべては知るところから始まる、ということだろう。日本でも学校基本調査の統計データが公開されているが、子を持つ親として欲しいデータがあるか、見やすいかと言われると「うーん」という感じである。

明日からできるオープンデータ

こうした配慮のおかげで、米国のオープンデータは、国民が日常生活の中で参照したいデータを、非常に利用しやすい形に仕上がっている。ひとことで言うなら「ユーザビリティが高い」となるだろうか。使われている技術もAPIに可視化ソフトウェアなどすでに実績のあるもので、「マイナンバーをブロックチェーンで管理」などに比べれば技術的ハードルは圧倒的に低い。どちらかというと大変なのは、情報所有組織との所有権調整や規制のクリアなどリーガル方面かもしれない。

最後に、オマケで紹介したいのが、本丸であるホワイトハウスの取り組みである。

Whitehouse – IT Dashboard

画像2

2009年に公開された連邦政府のIT投資パフォーマンスを分析するサイトである。もともは各省庁のCIOが利用するために作られたツールだが、どうせなら国民に公開してしまえとなった。IT投資の分野、KPIの達成評価などが見られる。IT Dashboardのソースコードは近日中にオープンソースとして公開される予定なので、ライセンス次第だが第三者が活用することもできるようだ。日本政府も利用を検討してはいかがだろうか。なお、省庁の支出全体の傾向を把握できるUSASpending.govというサイトもある。

ここまでくると、米国連邦政府というのは何か露悪趣味でもあるのではないかというくらい、情報公開に対する執念を感じる。この根底には、基本的にアメリカ人があまり政府を信用しておらず、権力をチェックする仕組みを作ることを重視する、というスタンスがあると思われる。この点については、また別に書きたいと思う。



この記事が気に入ったらサポートをしてみませんか?