【京都大学公共政策大学院・地方行政実務実況シリーズ】「オープンデータとデータ利活用について」(第4回授業:2019年5月7日)

1. 今日の授業のポイント

スライド1

今回は4回目ということで、オープンデータとデータ利活用について考えます。今日の目的は、無意味にこの両者を並べている訳ではなくて、昨年度の授業でもお話したり、他の場所でもお話していることで、一定整理ができたと考えているものです。

ポイントとしては、オープンデータを理解することが、この授業が扱うテーマの最初の入口のようになってきていました。ですので、次の2回にわたる授業はそうなのですが、第2回、第3回の授業のようにデータ利活用から考えるというアプローチが重要です。こうしたことが理解できると、今日お話することもすっと理解できるのではないかと思います。

その上で、次回と次次回ではデータを触っていくフェーズになります。そうすると、データについて、オープンデータ側から理解するかデータ利活用側から理解するか、ありますが、そもそもそういう両者の関係を理解する(=メタ理解)ことを意識してもらえればと思います。

今、何の話をしていると思いますか?一見関係なさそう、オープンデータのことを言っていないにも関わらず、そのことを議論しているというようなことです。実務をやっている人間も、理解できていないことが多くて、それがために話が進まないことがあります。

そうしたときに私がお話しているは、この両者は両輪であるということです。その上で、オープンデータ側からお話をする、というのがこの界隈ではよくあることですので、そういう説明をしますが、あくまで両者と、別々のもののように言っていて実は同じことであるということを意識してお話したいと思います。

2. オープンデータとデータ利活用概論

スライド3

前回の授業で紹介しました2つのサイト、オープンデータのサイトとデータ利活用のサイト、いずれも総務省が研修を実施しているものですが、ここには全てとは言いませんが、だいたいのことを載っています。このサイトをご覧いただいて、どういうことを感じましたか?

私の立場からすると、どういうところに興味を持ったかあたりが気になりますが、どうですか?

A すべての自治体が取り組むということで、既存の情報公開との違いについて説明が興味を持ちました。なぜそういう説明をして、オープンデータの説明をするのかについてなぜだろうと思いました。

なるほど。みなさんもその点は同じように思われたかもしれませんね。

そもそも、みなさん「オープンデータ」については以前聞かれたことはありましたか?情報公開もそうですが、オープンデータも、日本発というものではなくて、いわゆる洋物の受容という側面があります。そして、日本が進んでいるかいないか、というのはあまり生産的な議論にはなりづらいので、「何をするか?」で議論した方が、実務的には重要です。とはいえ、そうした「神学論争」を結構しがちなので、一旦は、ご覧いただいた第一印象は保持いただいた上で、次回次次回でデータを触ったときに、それがどう変わるか変わらないかも楽しみにしてください。

私も、感想をみなさんとシェアしますと、オープンデータ研修ポータルもデータアカデミーも、両方関係者が知り合いでよく知っているので言いにくいことですが、いずれも「とっつきにくいな」というのが率直なところです。

いずれもこれまでまとまった情報がなかったところからこれらのサイトの登場によって、充実したことは間違いない。しかし、第2回授業ではないですが、ユーザーフレンドリーではないというか、敷居が高いように見えます。決してよく見るとそうではないのですが、そういう印象を持ってしまいます。これを見るように言われた実務者は、やはり難しいのではないかと思うんでしょう。

①データ利活用?

スライド4

そもそもを考えたときに、なぜ「データ、データ」と言うのでしょうか。iPhoneの話や第3のプラットフォームの話をしました。それは2007年とか2008年でしたね。それに続くということで、2013年という少し古い資料を敢えて持ってきました。その当時議論されていたことを示しています。

2010年前後、データを使うことのコストとそれによる収益が逆転してきて、この場合はビジネス上ですが、データ分析による収益増加が拡大してくるという話です。データを使って何かをすることが、メリットが出るあるいは競争力をつけるためにはデータを使わないといけないということです。

それを可能にしたのは、CPUの処理能力といったコンピューティングやネットワークといった環境面、アルゴリズムといった分析するためのツールそのものといったものが、この2010年前後に拡大してきたということでした。それは2008年前後に生まれた、Hadoopなど仮想技術というものをちょっと資料に載せていたのですが、こうしたことを背景にしている訳です。

左側のインフラ的なものが加速度的に、グラフのように右肩下がり、急速に下がるのはこの世界ではよくあることです。他方でデータから得られる利益とされたグラフがこういう曲線になるのかは、よく考えてみると実はそうなのかどうか分からないなと思いつつ、ともかくこういう構図で語られるようになったと理解しましょう。

②2種類のデータ分析

スライド5

そこで、ここで言われている「データ分析」には2つ種類があるということです。Re-activeとPro-activeということで、過去を見るか未来を予測するかです。これはデータ分析であれば当たり前のお作法であると思いますが、重要なのは、後からでも出てきますが、「何のためにするか?」です。この資料は、ビジネスにおいて、情報活用が加速する中でどのようなイノベーションが生まれるか、あるいは生み出すべきかという文脈で言われているものでして、その分野として、マーケティング・リスク管理といったものでは、既存のビジネスをより洗練させようということが書かれています。その上で、一番下に赤字で囲んでいますが、「新規サービス」を生み出そう、あるいは生み出すために何をしようとあります。すごく抽象的に書いているだけですけれども、続けて説明があるのは、その典型例がビッグデータビジネスであるということです。

③データの種類と活用類型

スライド6

ビッグデータが何であるかは、定義は詳しくは説明をしません。4つのVと、性質を分けて、VolumeやVerocityという概念で説明もありますが、ここではどのようなものがあるかを説明します。行政であれば、ここに挙げられているような種類のビッグデータを使いたいな、ということが言われるようになってきました。2013年です。日立製作所という大手企業がこのように整理をして解説をしている、というシチュエーションだと理解してください。

つまり、行政側はこうした整理をする側ではなくて、あくまで読者です。「ああ、こういうのがあるんだな、何かしたいなあ」と思う訳です。では何に使うのかという整理をしますと、右側のとおり、例としてはみなさん聞いたことがあるものを書いてみましたが、Tポイントのようなもの、Googleはわかりやすいかと思いますね。この他カレンダーアプリを皆さん入れているかもしれませんが、個人の予定を収集する意図が個人個人の行動を把握することそのものにあるかはありますし、それを「けしからん」とお感じになるかもしれませんね、それについては、アプリの利用規約をよく読んでみてください。その上で、個人のスケジュールからヒューマンビッグデータを収集して、Pro-activeな分析によって何かに使える、例えばある人が集まることが分かることで、何かしらのマーケティングをするだとか、渋滞予測の一部にするとか、そういったことがありうる訳です。

④データ利活用が求められる背景

スライド7

そうしたときに、行政がどれだけデータを使っていたでしょうか、ということになります。資料は、総務省が地方公共団体におけるデータ利活用ガイドブックが整理しているものです。

これまで申し上げた、かれこれ10年にわたって説明されてきた「何のためにデータを使うか」については、日本の行政においては、人口減少社会への対応するために、データを利活用しましょうということです。
大きくポイントは2つで、
・生産性向上
・これまで人口増加していた日本社会のトレンドが変化したときに、Pro-activeなデータ分析をすることで、何ができるか・何をすべきかということを考え方をとるべき

というような整理です。

例としてRESASは聞いたことがあると思いますが、こうした政策を進める「地方創生戦略」とセットで出てきたものです。RESASが扱っているデータがビッグデータなのか、という議論はありますが、様々なデータをWeb上で分析する仕組みを構築して、地方自治体でも活用するように推奨しました。京都府でも将来像の検討に、全額国庫負担で1500万円を活用して、京都府の地域分析や特定のテーマ、商店街振興や観光といった人流データを活用した取り組みがありました。

それが5年あまり経過して、国も検討を進めており、これから自治体も順次戦略を改定していくところで、これまでを総括してこれから何をするかアップデートをするタイミングです。こうしたことにRESASを使うと言われています。

もう少し引いてみたときの説明の仕方としては、3つ目でありまして、そもそも地方公共団体って何のために存在しているかということです。それは、地方自治法では「住民の福祉の増進を図る」、「住民の福祉」は多義的な概念ですが、これからの人口減少社会における住民の福祉のために、行政は何をすべきかを考える際に、「勘や経験ではなく、データによって現状を明らかにしたり、データそのものを住民サービスに活用したりすることが重要」とされています。

ですので、ここで気をつけないといけないのは、人口減少社会というのは、あくまで「現象」です。課題として措定しても、そこから「何をすべきか?」ということを深堀りできるようなものではないということです。例えば平均何%減少という言い方をされても、平均で言われても何のことかわからないですよね。授業で日経のサイトで所得の増えた減ったということがまだらになっていることをお示ししたかと思いますが、一定の人口減少の中で、さらにどういうデータがあればその現象が分かるのかということをさらに考えていかないといけない訳です。

また、最近出された曽我先生の本にガツーンと書かれていたものですが、総務省の整理は「人口減少社会への対応」ということですが、アカデミズムからは「人口を前提とした考えるやり方はどうなのよ」という指摘があるとおり、この5年いろいろやってきて、その政策の成果が出ているのかいないのか議論もあります。このように、人口をベースに考えても、人口減少を前提にして分析しても、何もわからないことが多いのです。

スライド8

これらはともかくとして、こういうICT技術が進展して、データを使って何かしたいなという時に、もっとデータを使えないかと考えることはもっともなことでしょう。例えば、子育てサービスを検討するとして、さまざまな条件を考慮して、それに応じたサービスを実施するというのは典型的な子育て施策としてあると思います。例えば、私も子どもがいますが、幼稚園なり保育園に入って、サービスを受けるというものです。そのために家族構成なりいろいろな情報を申し込み書に記入して、収入に応じて保育サービスの対価が決まって、それを支払うことでサービスが開始されている訳ですね。その際に、その情報としてよりきめ細かいことが分かれば、より家庭の状況に応じたサービスが考えられることもお分かりになるでしょう。例えば、家庭の状況は様々ですよね、親が近くに住んでいるかどうかや、最近は高齢出産も増えていますので、そうすると子どもが幼稚園や保育園に入るころに、祖父母の介護の問題に直面するというご家庭もあります。子育てにかかれる時間に影響もあるでしょうし、それは働き方にも影響があるでしょう。そうした方に対して、保育サービスの料金を下げるのがいいのか、サービスの内容を充実させるのがいいのか、あるいはそうした人をどうやって把握するか、これらを考えるためのデータはどのようなものがあるか。そのためにどのくらい予算を用意する必要があるか、こうしたことを実務のレベルで検討するのはなかなかシビアな話ですが、データを使うことでサービスを向上することができるのではないかと考えられる訳ですね。

あるいは、この他にも、前回授業で説明したように、デジタル化っていろいろできますね、と。そうするとこれまでできなかったことができるようになるためや、もっと時間をかけてやらないといけないことに時間をかけるために、生産性を向上させましょう、というときにキーとなるのがデータであるということですね。

スライド9

ですが、ここでも総務省のガイドブックはこう整理していますが、では、最初から行政職員がこれができるのか?といえば、そうではないということです。当然やりたいのだけれども、どうやったらいいんだろうということですね。ノウハウがない訳ですので、それは学ぶ必要があって、それにはこうした大学という場があったり、セミナーがあったりする訳で、やはり何かを学んでそれを実践して試していく、試すという言い方は軽い言い方ですので試行錯誤しながら取り組んでいくという言い方としますが、そのため学んでいかないと行政としての足腰が強くならない。では、1800自治体でそれができるかという話、例えば京都府であれば、今日も参加してもらっているように、京都府では、職員をこの京都大学公共政策大学院の学生として入学して学んでもらうという制度がありますが、全ての自治体でこうしたことが可能かはあると思います。

こうした人材育成は様々なやり方がありますが、それとともに、具体的に何をすればいいのか、考える際に、先ほどの例ですと、子育てと親の介護両方を考えないといけないのではないか、という例で議論してみましょう。両者の問題は、同じ健康福祉部門の担当課が議論すればいい訳ですが、部署は縦割りで組織されているところが、同じ課題だけども、違う角度で仕事をするように割り当てられている訳でして、すぐ同じ課題に両者が協力して検討できるのか、は難しい訳です。これをセクショナリズムだと悪い意味で言っている訳ではなくて、それが当然で成り立っている組織において、意思決定のプロセスが違う中で、どうやって横断させるか、あるいは専門知識をどうやって蓄積していくか、双方のアプローチを横断的に検討するということそのものをどう理解するかという点は、すんなり自然にできないというのを前提にしなければならないということです。また、「昔はこうだった」とか「他の自治体ではこうだった」といったある種の成功体験が、組織としては縦割りということで現れてくるということもあろうかと思います。

あとは、「データ」という言い方をしたときに、私は情報政策課に属していますが、こういうICTとかITと聞いたときに、「それは得意な人がやるもの」という理解があると、個人としての抵抗感というものがある訳です。そして、総務省はこうしたガイドブックをもっと使って欲しいと思っている訳ですが、必ずしも全部の団体が使っているものではないです。さらには、ガイドブックの形になれば本来は誰でも使えるものであるはずですが、その手間で「それは特定の人がやるべき」という考えによって、こうした取り組みが進まないということもあるでしょう。

今回、総務省がオープンデータなりデータ利活用なり双方で共通に持っている認識は、こうした人材育成にはステップがあるということです。よくあるのは、「データ利活用します」と言ったら、いきなりStep4を言い出す、言った以上はやり切るというのは、いいことですが、Step1から先がどのくらいかかるのかわからないままやって、途中で疲れてしまうとうことがよくあります。

⑤RESASの教訓?

スライド10

それはRESASの教訓?という言い方をしましたが、RESASはその登場は華々しく、丁寧で、お金もかけて構築したもので、新しい仕組みも出しています。その過程で、担当の内閣官房の方と意見交換もしたことがあって、「自治体の評判はあまりよくないですよ」と申し上げたことがあります。それは「これはこれでいいんだけど、実際これを使って知りたいことがズバリ分かるわけでもないにも関わらず、国がこれを使ってください、というのはボタンのかけ違いが起こっていますよね」ということです。

京都府の場合は、Step1からゆっくりやるんです、そしてRESASが使える場合もあるけど、どういう点で使えないのか具体的に理解するように取り組んでいますよ、と申し上げたら、担当の方も「そうですよね」と同意いただきました。

この点は、改めるべきことは改めましょうという至極当然で好ましいものではあります。やはり、このように「データを見せます」ということから、右側のように、知りたいことをデータで出力して使ったもらおうという形の機能が増えています。データの出力そのものは、これまででもできたことでして、こういう形に実装して提供しないと、そう思われないという「痒い所に手が届く」というものにすることで、そこから次のステップにつながるようなサービスとしてRESASの位置付けを変化させようと、これは意識的にしたようです。

総務省のガイドブックもこのRESASも、「データは用意したので使いなさい」というものから、「どうやって使うか」というナレッジとともに提供していく考え方を改め、「よりよく使ってもらいやすいように、よくしていくので、一緒に使いましょう」というスタンスが明確になってきていると思います。

逆に言えば、RESASに対する先入観が自治体側に今もあるとすれば、実はスタンスがもう変わってきているので、同じく税金を使って整備しているものですので、自治体側もこれをどう使っていくか、使い倒して「これじゃ足りない」と提案するようになっていかないといけないと思います。

⑥より広い教訓?:「日本版NPM」

スライド11

もうちょっとメタの話を続けますと、この手の「データを使って何かを考えよう」ということが、これまでの行政になかったことなのか?ということについては、これも同じく曽我先生の近著から引用しますが、事後評価における数値化が強調されるようになったのは、いわゆるNPMが日本に入ってきた1990年代後半であると書かれています。

私は別の角度から、この1990年代後半を捉えてもいまして、それは地方分権の流れです。自治体の自立・自律性を強化する動きの中でどうだったのかという話ですが、ここではNPM側の説明で書かれていますのでそれで続けましょう。この時期、いわゆる改革派といわれる自治体が出現し、その際に用いられたのがNPMでありまして、行財政改革や職員の意識改革とセットで、以前の授業で説明したとおり、2000年前後の国のIT政策の一環で、自治体でもITへの投資がなされてきました。

これらの成果がどうだったのか、ここまでの話はこれまでの5年とか10年といったスパンでお話をしていましたが、20年さかのぼったレンジで考えるべきではないかと思います。

曽我先生の整理だと、データを使った政策評価を何のために使うのか?NPMの「日本化」があるということです。
つまり、
①当時直面していた財政の困難を解決する
②具体的には、これが一番重要だと思いますが、政策目標の実現のためのプログラム、政策評価の授業を取られておられる方はお分かりのとおり「プログラム評価」というものですね、行政の話ですとこういう説明の仕方になりますが、冒頭のデータ利活用の説明がここで出てくるわけです。つまり、行政はマーケティングとかリスク管理という言い方はするかは別にして、政策を遂行して何かしらの現状を変えていく、企業であれば売り上げを上げる、行政であれば、抽象的には住民の福祉を増進させるというものになるはずですが、ここで言っているのはそうでは「なくて」、資源管理、つまりこの時期ですと同時に指定管理者制度やPFIなども導入されていますが、「誰がどのようにやるのか」、「それによってどれだけお金が浮くのか」、これは行政が何かをする・しないを決めるときの「どれだけの体制をしくか」「どれだけの予算を使うか」という資源管理を、首長が行政組織を使っていくための手段として活用する訳ですね、そういうものとしてNPMをいわば矮小化してしまった、ということが今に至っているということです。
③数字を使って仕事をしていると言わないと、今もそういう話もありますが、行政はごまかしをするのではないか、と言われていること

こうしたことがデータの話でも、そもそもの行政のやり方というものが効いているということも含めて考えてしかるべきだなと思います。これは繰り返しですが、私がこういう授業でこういうお話をする問題意識そのものでもあります。データ、デジタルというときに、ITについて考えるのではなくて、地方自治体が何をするか・今後すべきか、という一局面としてたまたまデータをしっかり使いましょう、というところで話をしていますが、問題として考えていることはこれらのことです。いわばガバナンスの話として捉えています。

⑦ガバナンスとしてのオープンデータとデータ利活用

スライド12

したがって、オープンデータというとITの話ではなくて、この資料のとおり、血液のようにガバナンスを円滑に進めるための手段としてデータを考えるとするものです。これは生駒市さんの説明ですが、データアカデミーとしてのデータ利活用の説明でも同じように、行政がいて、行政じゃない人がいる、両者を結びつけるものとしてデータを考える、その一部がオープンデータである。

ですので、行政がオープンにしないデータも使う、それが行政がやることの最たるものだと思いますが、そういうものではないものはオープンデータですと。もともとデータを用いて両者を結びつけていきましょうという、この資料でいえば、赤線と青線とが行き来するようなことを考えましょうということです。では、行政の外に出て、多様な主体が参画する世界の中で、データを使いましょう、と言えば、それはオープンデータということかと思いますが、別に庁内においても様々な部署が使いましょうということでもある訳です。そういう関係を作っていく、まさにガバナンスだと思いますが、それをオープンデータの世界でいえば、オープンガバナンスですし、データ利活用の世界でいえば、この資料には書かれていませんが、全体をオープンガバナンスだと言ってもいいと思います。

3. オープンデータとデータ利活用

①行政実務における両者の適切な関係を考える

スライド13

オープンデータも、「データ」と書いていますので、それはあり方として考えればいい訳です。とすると、データ利活用とは何ですか?と考えるときには、それがどういうときに使われるのか、あるいはオープンデータの定義に即して言えるものなら、それはオープンデータです、とすっきり言えるのではないかと思います。

ということで、最初の問いかけの私なりの答えは、「なぜサイトが2つあるのか?」となります。オープンデータとデータ利活用のサイトが2つあるのはなぜだろうと。その答えは簡単で、総務省の同じ局の中に担当が分かれた形で業務が割り当てられていて、それぞれが仕事をするためにそれぞれで予算を取っているんですね(※2020年度時点には、この状況は解消され、地域情報化推進室がともに担当しています)。オープンデータの方が先に出てきていた話で、RESASのときの同じで、進めていて途中で「あ、ナレッジ共有型じゃないといけない」と気がついた、他方のデータ利活用は最初からナレッジ共有型です。そして、自治体に人気なのは後者だということです。前者について、「なぜ自治体で取り組みが進まないのか」ということが言われますが、話は簡単で「進まないような政策の方向性が作られたから」というものでして、それは昨年度気がついたことです。それは、データアカデミーの方に、データ利活用の説明の資料の中に、部分的にオープンデータについて言及する形で表現されていることです。他方で、オープンデータの研修において、正面からデータ利活用について取り上げたものがないということが証拠かなと思っています。

普通同じことが、別のように言われることがありますね。それは単純に2つの形で用意されているから、という単純な理由です。私自身はデータを使う、そういう元の発想から考えたときには、オープンデータとデータ利活用両者は一体のものとして理解していますし、そう理解した方がすっきりします。それを2つのものとして見るので、モヤモヤするというだけだと思います。

となれば、ここから先に授業を進める上では、先にオープンデータの話をしておかないといけないので、そうします。もともと考えるべきこととしては、データ利活用の資料に書かれています。

②課題から考えるデータ利活用

スライド14

昨年度であれば50団体くらいが取り組んだことをジャンルに分類したものが、この資料です。これをいろんな形で横展開を考えていきたいとされています。

③データ利活用のプロセス習得

スライド15

データ利活用において語られていることが、この資料です。そこには、「データ分析だけでは、答えである政策は出せない」、つまり「データ利活用のプロセスで理解しましょう」というもので、RESASでは答えが出せない、ということです。この表もわかりにくいかもしれませんが、仮説を作って、データを確認して、分析手法を確認、これは難しいとは思いますが、そうあります。データアカデミーでこれを実践している、Code for Japanの市川さんとお話していておっしゃっているのが、このプロセスに時間をかけるとおっしゃっています。ハズレが出そうなところでやるのではなくて、成果がでそうなところで取り組む必要があるということ、そして、政策を作る人たちがしっかり考える、有識者と呼ばれる方々が話をする政策と言われるもの、あるいは物の本に書いてあるものを適用してみようとか、考えてもうまくいかない。もちろん、専門家を使うとか、担当だけでなく縦割りを排除して庁内で協力をするということはよいことですが、あくまでも担当者が政策課題を確定させていくこと、Stepを行ったり来たりすることもありますが、しっかり取り組む内容についての確信を持たないとゴールに絶対にいかないということです。それはすごく大変なことですが、このプロセスをしっかり学んで欲しいということです。

この授業ではこれと同じことはできませんが、このようにしてこれからは政策を作っていくんだなということをまず理解してください。そして、そういうことを実現するためには、どのようなスキルが必要なのか、シラバスでも書いたことですが、それはできるだけ生のデータを触っていただいて、印象論を排除することが重要です。

④活用側から考えるデータ利活用

スライド16

では、どんなデータを使うんだろうか、を考える上では、十分なものではありませんが、この資料はオープンデータで想定して、民間企業はどのようなデータを必要としているのか?とまとめたものです。民間企業も、さきほど説明したデータを使ってビジネスしたいのですね、その際にどういうデータが欲しいのかというものです。ぐるなびの例はわかりやすいかもしれません。新規開店があったときに、今は個別に調査をしているということですが、行政側からオープンデータで提供されると、いち早くそのお店にアクションをして、メニュー開発やクーポン発行などによってお店の売り上げを上げていく提案をしたいということでしょう。みなさんも、百万遍付近であればすぐお店は見つかると思いますけども、そこから少し離れたお店をどのようにして知ることができるか、と考えてみてください。また、お店からしても、評価が少しでもよくなることであれば、それが売り上げと関係あるということですね。こうしたことを実現するために、行政がコストをかけずにデータを提供できれば、非常に効果がありますよね、ということを言っています。

⑤オープンデータ推進の意義

スライド17

こうした活用側から考えるデータ利活用のトレンドということでは、オープンデータの話がずっと言われてきたものであり、もうすでに一定の整理がついたという考えです。それは、官民データ活用推進基本法において、オープンデータ推進が義務づけられたことからわかります。基本的にはそういうことが決定されています。そして、2020年度末までにすべての自治体については、オープンデータを公開するということになりました。それは、この基本法を受けて策定されている「世界最先端IT国家創造宣言・官民データ活用推進基本計画」において、目標設定されています。

その上でこの計画は、政府のお作法をご説明しておきますと、だいたい6月にですね、次年度の予算編成にあたっての基本的な考え方を、「骨太の方針」として人口に膾炙した成長戦略などとセットに随時更新され、そのときどきの最新のテーマがそれぞれの計画に相互に関連づけられて持ち込まれていくものです。そういういわば体系の中に、このオープンデータを公開するということが組み込まれて、それに基づいて総務省だったり、内閣官房が自治体に向けてあーだこーだ言う訳ですね。

それと、法律ができて、ではどう言う風にやっていこうとなってオープンデータ基本指針が策定された訳ですが、そこで定義が3つに整理されています。

まず最初が、国民の参加、官民の協働といったいわゆるオープンガバナンスに関わるもので、「行政が」というよりも、「行政を使って」世の中をよくしていくために、いろんな人たちが参画してやっていきましょうというものですね。「人口減少社会」といったカッコ付きで表現しますが、そのような社会課題を解決するためにオープンデータを使っていこうというもの。2つ目が、そのためという側面があるとは思いますが、その使っていく「行政」の高度化・効率化を進めていくためという側面、そして、さきほどの「お手盛り」話ではないですが、オープンデータの由来といってもいいでしょう、「透明性・信頼性の向上」ということが言われているわけです。

その上で、自治体においては「地域の課題を解決する視点」とありますが、これはのちほどの授業で取り上げるような事柄でして、これは追々説明していきます。

⑥官民データ活用推進基本法におけるオープンデータ

スライド18

それを次の資料で、内閣官房が用意しているポンチ絵で説明しましょう。
「オープンデータとは…」、とあるところに赤字で強調されていますが、
①二次利用可能なルールが適用されたもの
②機械判読に適したもの
③無償で利用できるもの
それぞれは、次回以降に、具体的に何なのか、実際のオープンデータを触りながら理解していきましょう。

⑦日本におけるオープンデータの特徴

スライド19

ここでは、なぜこういうようになったのかを説明しておきましょう。
それは、日本においては、東日本大震災以降の流れが関わっています。オープンデータは別に行政だけの話ではなく、民間企業もオープンデータを公開すべきという話もあるでしょう、日本においては、東京電力の計画停電の際に、どのエリアがそうなるか知りたい人たちが、東電のサイトにアクセスして見れなくなるといったことが起こりました。そうしたときにヤフーのサイトでそのデータを公開するとかですね、ボランタリーに公開するといった動きがありました。その他にも、あの当時、私も避難所運営支援で現地に行っていたのでよく分かりますが、避難情報をきちんと知りたい人に届けるような仕組みがなくて、情報が錯綜したりといった状況がありました。そこで、これもボランタリーに情報をまとめてみるとかですが、どこでどのような被害があるのかを可視化するという動きがあった訳です。

資料でお示ししているのは、その後の流れということで、例えば昨年は、中国地方を中心に豪雨災害で大きな被害があった、岡山県の倉敷市真備町での活動です。まちケアと呼ばれる、災害時の情報提供、例えばボランティアの拠点がどこにあるのか地図で示し、その拠点では何ができるのか、これらは元のデータがあるのですが、行政の出しているデータをこうした形でまとめて発信するというものです。

こうしたものが簡単にできるのは、オープンデータの定義を実現しているデータがあるので、こうしたことができるというものです。これは岡山のデータクレイドルという団体と大学研究室が共同して運営されているものです。ここでは、行政の公式サイトでの情報発信ではなくて、別に行政のサイトでもいいと思いますが、こうした必要な情報を速やかに立ち上げることができるか、これそのものが、東日本大震災のときの問題意識であった訳ですが、その後に頻発する災害発生時にも同様に活動するといった流れは、おおまかですがやり方といったものもまとまってきたように思います。そして、なにより、こうした動きが継続され、徐々にブラッシュアップされていくことは積極的に評価すべきことだと私は思っています。

スライド20

さきほど3つの意義を申し上げましたが、法律ができる前、私の場合は、平成27年度からこの話に参画していますが、そうした話が、すんなり理解されるようなことではなかったように思います。それは、「なぜオープンデータなのか?」ということで、さきほどの3つの意義をバラバラに考えるような思考があって、そのどれかが「できないよ」といった話になった途端、他の話が止まるようなことが散見されました。ただ、まあこれも今もそういうことを言う人が多いので、法律をきちんと読みなさいよ、と思うのですが、ここでは資料のように、「順序問題と考える傾向」が、その根底にあるのではないかと考えます。つまり、ステップを踏むということをさきほど説明しましたが、最初にゴールのところを考えた上で、最初ができないということを「これはやっても意味がない」といった考え方に帰着させるというものに変質させてしまっています。例えば、行政のデータをオープンデータとして公開しましょうと言ったときに、「ホームページで情報公開しているから、オープンデータをやる必要なんてない」と、これは後ほど説明していきますが、「公開」と「開放」の違いを、自分勝手にあるいは自分が考えられる範囲で考えてしまうことによって、オープンデータが狙う意義全体を台無しにしているようなことも見られるわけです。これは不思議な話で、なぜこうなってしまうのかは議論すべき話ですが、私なりには順序問題にしてしまう考え方の人たちには、そうとしか思えないのだろうと理解しています。

スライド21

では、どう考えるべきなのかについては、次の資料が私なりの考え方です。順番というよりも、まずは今日もこの授業はいろいろな方が参加していただいていますが、そのような場を作ることが肝心です。つまり、「参加・協働」がなければ、あるいはそれがあれば、他の諸点も徐々に始まっていくような相互作用があるということです。それを通じて実践することで、「ああ、こういうデータをちゃんと出せば、こう使われるんだ」という理解があって、初めてオープンデータの意義を理解できる。また、参加・協働を通じて、自分だけでする訳でなくて、それぞれができることを持ち寄って少しずつでも実現していくといった極めて実際的な話であるべきです。それが若干難しくなるのは、右側の「経済活性化」のところだと思いますし、これは今でも「オープンデータによって経済が活性化したのか?」と言う方もいますし、それは道半ばだと言わざるを得ません。しかしながら、行政内部でこのようなことを言う人たちに対しては、法律上に義務付けされた以上は、説明責任として行政側にそれが分配されていることに意識が及んでいないことが多いことを指摘しないといけないと思います。つまり、「なぜ?」というよりも、「どうやってやるか」について応答するべき事柄を、そのことの評価に留めてしまうような考え方は、法律の前後で変わったと理解すべきということです。それだけの意味が、法律の義務付けにはある訳です。できていないからダメだとか、言っている間はそれでもよかったと思いますが、それは平成28年末の時点で終わったことであり、その時点でマインドセットを変える話である訳です。実質的な議論であればいいと思いますが、建前を言うようでは、法律を読んでいないことを自分で告白しているようなものです。また、オープンデータに限らず、さきほど申し上げたことであれば、そうしたマインドセットを変化すべきことは、20年前からあったことだというのが私自身の考え方です。

ですので、オープンデータだけ解決したら、国の目標を達成したらいいというものではないですね。オリンピック後に急激にカッコ付きの「人口減少社会」が加速する中での、国の活性化を図るためにどうするか、それはオープンデータの意義が示しているような、その背景にあるマインドセットの変化を行うことだということかと思います。

4. 京都府の取り組みを通じて考える

①京都府の特徴

スライド22

そうしたときに、京都府はどうでしたか、ですが、国の目標についてはすでに達成済みです。市町村のみなさんにご協力いただいて、府内市町村すべてオープンデータを公開するところに至っています。取り組みの特徴としては、市町村単独で実施が難しいので、みんなで取り組める形にしているという全市町村参加型であるというものです。市町村さんも共通で運営しているネットワーク上でオープンデータのサイトを構築したということ、そして、その公開するプロセスを共通化したこと。それは、こうした考え方が出てくる前に、共同で構築していたシステムを活用して、全市町村が同じ形で持っているデータを、このシステムを利用することで自動的にオープンデータになるように仕組みを作ったというものです。そういう形であれば、市町村さんの中で、自分たちでデータを出そうということであればその仕組みによって楽に出すことができる、あるいはそうではない市町村さんでも、使っているシステムが同じですから、他の団体でやっていることを自分たちに適用することが容易で、同じようにできるという見通しが立てられること、それが全市町村が参加していることの最大のメリットだと思います。

アクセス数は、多いか少ないか議論がありますが、まずまずといったところです。ファイル数はまずまず増えてきたといったところです。また、京都ならではというか、大学からのアクセスが多いことも特性です。ですので、この授業のように、大学のみなさんに関心を持ってもらうようなマーケティングも重要ですね、ということでしょう。

人気のオープンデータは、さきほどの話のように、行政は人口のデータを熱心に集めていますので、みなさんもそれを見るというような関係があります。

②全国の状況

スライド23

そうした状況が全国的にはどうか、が次の資料です。
左側で、取り組み済みの自治体としては、福井と京都が100%となっています。右側で地域別に見ると傾向がわかるかと思います。縦軸はオープンデータ取組済みの割合、横軸は、取組済みの団体の数、円の大きさは、その地域に含まれる団体の総数です。関東であれば、円の大きさが最大になっているとおり、関東の自治体数は非常に大きいので円が大きく、取り組み数も右側にいきますが、取組割合としては30%前後ですので、この位置に来るということですね。

こう見ると、3つグループがあるように見えます。全国平均は26%ということで、そこから上なのか下なのか。近畿であれば、京都がその中に含まれていて平均を押し上げていますが、次の1年でどうなるのかで決まってくるのではないかと思います。

③京都府の100%達成のコツ

スライド24

では、なぜ京都は全国的にそういう傾向の中で、100%達成ができたのか、というと、総務省のオープンデータの研修を活用したということです。総務省の研修というのは、2020年度末までの目標達成のため、3年計画(2018、2019、2020年度)で、すべての都道府県単位でオープンデータの研修を実施しようとしており、その最初の年度に京都で実施いただきました。最初の年度になったのは、今は100%となっていますが、その前が8%くらいで、近畿の中では低い方だったということで、声がかかったのです。実際は、その時点で100%にする方法は仕込んでいたので、必ずしも研修を実施するような状況ではなかったのですが、総務省の研修を活用して100%達成するということを、後続する都道府県に分かりやすい形を、総務省を経由して伝わりやすくすることも意味があると思って、実施することとしました。

つまり、研修を通じて100%を達成するという、わかりやすい成果とすることで、市町村さんも「ああ、総務省の研修での意味も分かります」と安心して取り組んでもらいやすいということですね。

その結果、外部の団体さんからも表彰いただくことになるなどあった訳ですが、今になって思うと他の都道府県は苦労されているようで、自画自賛にはなりますが、分かりやすい筋道を作って実施しないとなかなか大変なんだなと思います。

スライド25

では、その京都の取り組みの特徴は何かと言えば、先日刊行した本でも取り上げていることですが、オープンデータとしてデータを公開するだけでなく、わかりやすい形で可視化をするということがあります。基本法の条文を読んでいただくとわかるのですが「容易に利用できる」とあります。これはオープンデータの定義のうちの「機械判読性」のことを指していると解説されていますが、それはそうだとして、エクセルのファイルでオープンデータにしたときに、それが容易に利用できるものか、それを可視化することで、どのようなデータなのかがわかる、ということをしています。本の中ですと、これは京都府だけの話ではなくて、札幌市や横浜市、生駒市、神戸市など他の団体でもされていることでして、こうすることでオープンデータの別の意義である「多様な主体が連携する」というときに、同じデータを見て議論する枠組みができるということでもあります。数字を見て口頭で説明するということではなくて、可視化された同じものを見て、立場が異なったりバックグラウンドの知識も異なる人々が同じテーブルに座って議論がクリアできるかどうかは、こうしたことも揃っていないとなかなか難しいものです。説明した内容も、人によって受け止め方が違うといったように、データをどう見るかはやはり難しいものですので、それを解決したい課題とうまく結びつけることもさらに難しくなります。そうしたことを容易にするために、可視化というものがある訳でして、それを使わないと「容易に利用できる」とは言えないのではないか、こうした問題意識に取り組んでいるのがまずは特徴です。

スライド26

もう1つは、さきほど少し説明したシステムの話です。これは京都府であれば、GISと呼ばれる地理空間情報システムというものがありますが、可視化が容易にできるような形でデータを蓄積して、それをスムーズに公開する業務フローを設定するという、行政の効率化にもつながる話ですが、こうした考え方を「オープンバイデザイン」と言います。オープンデータを前提にしたプロセス・システムを考えるということを、すでに市町村共同で構築していたGISシステムで実現するということをやったことは、市町村さんにもすでに馴染みのあるシステムを使っているという意味でも、オープンデータ公開の心理的ハードルも低かったのではないかと思います。つまり、オープンデータが義務付けされているのであれば、それが容易にできるように考えることも必要であって、いきなりすべての事務についてできる訳でもありませんが、まずできる方法を示すことが重要であったと思います。

京都府の全市町村でオープンデータ公開したと言っていますが、少なくとも、そのGISのデータの1つであるAEDの設置場所を出していただいています。これは次に別のデータでオープンデータに取り組む際に、他のGISデータもある程度蓄積している団体があること、GISデータは、それぞれを組み合わせることで、様々なことがわかるという特性があること、そういったことを考慮して、GISデータから始めたというものです。根っこのところで、データを作れば、自動的にオープンデータにできることさえ分かれば、その担当さんは自分が持っている別のデータでもやってみようとなる、あるいは、別の部署に異動しても、同じGISシステムを使えばその新しい担当部署でのオープンデータもすんなりできる、といったサイクルが働きやすいと思います。そうしたことが行政の効率化・高度化にとって一番実際的で現実的なアプローチだと思ってやっているものです。

スライド27

そして、多様な主体との連携という意味では、2つ取り組みがありまして、1つは「共創ラボ CO-LAB Kyoto」と呼ぶ活動、各地域で課題解決を進めるためのアクションのためのプラットフォームづくりと、いわゆるスマートシティ実現のための産官学連携のモデル構築において、これはオープンデータやビッグデータを活用しようとなりますが、こうした枠組みでやっていることも特徴だと思います。オープンデータ側から言えば、こうした活動からのニーズがあるわけなので、それに対応できるようにデータを整備していこうということになります。

こういう活動には、このスマートシティでいえば、会津若松市が先行していて、関係者と意見交換をさきほどまでしていたのですが、全国各地で様々な形で取り組みが進められています。そうしたことを情報交換しながらうまくお互いのよいところを吸収していくことが重要でして、京都もまたそういう中でやっているということです。

④今後の取り組み

スライド28

そして、オープンデータ公開という意味では、自治体が100%公開したら終わりということではないことは、当然のことでして、この資料は内閣官房が全国の自治体にアンケート調査をしたうち、京都府内の市町村分だけ抽出したものを示しています。さきほど説明してきたとおり、市町村単独で研修があるかと言えば、それはない、普及啓発もなかなか取り組めていないという状況。それには利用者のニーズ把握も難しいということですね。そうした状況ですので、100%達成を踏まえて次のステップに向かうために、達成のときと同様に、市町村さんと共同で取り組むために、ワーキンググループ を設置して議論しています。

スライド29

その中の取り組みとして、オープンデータのサイト改修も検討する、新しいオープンデータにも取り組む、そしてこの授業にも府内市町村さんも参加されていますが、そうしたことの一環です。府内市町村だけでなく、他府県の団体さんも授業には来られていますが、それぞれにどのようなニーズがあるのか、どのような問題を抱えているのかをざっくばらんに意見交換することで、京都府にとっては問題ではないかもしれませんが、その考え方が参考になることがあります。他府県の事例もあくまで自分たちに置き換えて考えることが重要で、その際、もともとの団体でどのような問題意識で実施していることなのかがわかると、そのことが自分たちで考えるときにも非常に参考になります。そのためにも、率直な意見交換ができるような関係を作れるように、こうした授業もそうしたことに資するよう意識していきたいと思います。

5. 次回授業について

スライド30

今日のお話は、オープンデータの置かれている、これまでの経緯は触れる程度にとどめましたが、状況についてご説明しました。詳細は、総務省オープンデータ研修に情報がありますのでご覧になってください。授業では、具体的な研修を実施するというよりも、それは次回からお話するような、実際に触ってみることにフォーカスを置いています。みなさんとやってみて、さらにアドバンスなこともということであれば、次回からの2回の授業を通じてそこにもトライできるかもしれません。

授業は、資料にあるとおり、オープンデータのカタログサイトに何かしらのデータを公開した後の結果側から考えられるような授業進行にしたいと思います。そのために、事前準備として、まずはメモを作りましょう。京都データストアから関心のある、例えばレポートに使うという意味で考えるといいと思います、データを確認してみてください。それがなかったということも重要なステップです。私の立場からすると、そのステップがどの程度多様性があるのかが関心のポイントです。

その上で、データがある場合に、そのデータの中身を見て、吟味してみてください。レポートを書く際に、データを使う、となったときに、それが使い物になるのか、何かしらの編集作業が必要なのか、そのためにどんなソフトを使えばいいのか、使う際にどういうことが難しいのか、といったことについて、だいたいの見当をつけてみてください。そのプロセスを記録するというのが、メモのポイントです。

もう1つは、そうしたら、「自分だったらこういうデータを作る」を考えてみましょう。具体的には、何かのデータを実際に1から作ってみてください。自分だったらこういうデータが必要だということで、何かのデータを集めてくるなり、自分で調査をして作成するということもあるかもしれません。一昨年度であれば、最初にデータだけでなく可視化までやってみようとしました。すると、データを整理するところと、可視化するところそれぞれで苦労したようですので、まずは前者だけにフォーカスを当てて、まずは自分でデータを作ってみる重要性に着目していただくことにしているものです。

データの形式も、今日の授業はエクセルエクセルという話をしていました。
形式もいろいろなものがありうるのですが、実はオープンデータは画像でもよいなど、とにかく京都データストアをご覧いただきながら、いろいろ考えてみてください。

6. 質疑

Q 京都データストアを見ているが、市町村別の人口動態というデータがある。2018年のものが揃っていないが、それはなぜか。また、国もデータがあると思うが、京都府もデータを掲載するということの意味はどこにあるのか。

A 人口動態のデータは、もとは京都府統計書のデータを掲載しています。オープンバイデザインの話でいえば、このデータは統計書をベースにしているからとなります。2018年のものはまだ掲載されていないのは、統計書には400種類くらいのデータがありますが、それを京都府のホームページには掲載されていますが、オープンデータの方にアップロードされていない、できていないというものですね。

国の話との関係はあまり関係ありません。市町村からデータをもらってそれを統合させているものです。遡及改定など必要な作業をしていますが、統計書の作成スケジュールとの関係ということですね。

Q 官民データ活用推進基本法で、地方公共団体がオープンデータ公開を義務付けられているということだが、その確認はどのようにしているのか。

A 中身はあまり検証していないです。それは自治体側が決めることで、データの多寡は問うていません。つまり、「1つでもいい」ということです。そうしたやり方が果たしていいのか、という議論もあるのですが、京都府の場合は、さきほどご説明した「なぜ1なのか」は説明可能です。「今は、1だけど、今後市町村がそれぞれの考え方でGISシステムを使って掲載が可能な状態になっており、準備が進み次第掲載が進むと考えている」となります。

逆に言えば、オープンバイデザインとしてならないものを、急いでオープンデータにする理由があるのですか?とも言えます。行政の高度化・効率化に資するのがオープンデータでしたので、それとは異なるやり方で取り組む必要もあまりありません。ですので、そうした業務フローにできるものから、順次取り組むことが回り回って効率化になっていくということではないかと考えます。

Q 国の方向性としても、データを(1つでも)公開するということで達成しているということか。

A 国も、オープンデータ公開が目標になっていまして、それはアウトプット目標ですね。もちろん、2020年度末までの目標の次の議論も始まっていますが、現に京都府内の市町村が1つ以上公開することで達成したという認識を持っていますので、そこは問題ないです。それを京都府が達成した際に「1でもよい」ことを示していますので、他府県も安心したのではないかと思います。

そうであれば、途中まで進んでいるところ(そこからの伸び代が期待できないところ)やそもそも国の方針に無関心な団体は目標達成が厳しいのではないかとも言えますね。

Q オープンデータの概念は、行政だけでなく、民間や市民にどのくらい浸透しているのか?

A どう思いますか?

Q 住民からすると、データの公開は分かっていても、オープンデータによって何が変わったのかは分かりにくいのではないかと思う。

A 確かにその面はあります。たとえば、みなさんでもデータを2次利用するときに、引用しますよね。そことオープンデータという言葉は知っていてもその内実がどう違うのかは、次回説明するように、利用規約の中心であるライセンスの話が、なかなか馴染みがなくて、確かに分かりにくいと思います。

私自身は、その内実の変化を理解せよ、というのが今日説明した基本法の制定趣旨だと思いますので、少なくともその名宛人たる行政については、「ホームページで公開しているからオープンデータには取り組む必要ない」という言は、もはや説得力はない、と思っています。

ご指摘の点は重要なことで、そのことは、普及啓発については、資料で示したように課題があるというアンケート結果が出ています。それには理由があると思っていまして、端的に「自治体も(オープン)データを使っていない」からです。自分たちで使っていないことについて、住民に啓発できるかという問題です。よく話をするのですが、自転車って、乗れたら説明できるじゃないですか。使えるようになって初めて、説明できることは多いと思います。オープンデータであれば、2次利用だとか機械判読性について自分で理解できないと、言葉として定義の説明はできても、人に分かりやすく説明できるかは別の問題だと思います。

他方で、ヨーロッパでは、もともと「行政が獲得したデータは、市民から提供され税金で運用されているものなので、市民に返して使えるようにすべきだ」という考え方があります。なので、そこから派生した2次利用なり機械判読性については理解が進んでいると思いますが、日本ではそうではないことを前提にしつつ、あるいはであるからこそ、行政が自らデータを使うということをしないといけないのではないかと思います。

Q オープンデータの議論のときに、提供する立場と提供してもらって活用する立場があると思うが、活用する立場には、フリーライド問題があると思う。そういう議論や問題意識はあるのか。

A フリーライドの話は、確かに指摘がある。理屈として行政はデータを出すけれども、使う人をコントロールできるものではないので、データを出した責任問題があるのではないか、その使われることに対するリスクがあるから、オープンデータはよくない、あるいは慎重に考えるべきだという人はいます。間違っていたデータが、それを使う人の責任ではなくて、行政の責任になったらどうするんだ、というものですね。

ただ、それはためにする議論であることが多く、もちろんそもそも出してはいけない個人情報といったものはオープンデータの議論からは排除されています。基本法の条文も確認しましょう。どのように使われるかわからない、ということをそういう言い方ですることの方が多いという印象があります。これも、データを見ずにする議論にありがちです。

むしろ、バランスよく議論するには、オープンデータによって価値を創出すること、それをどのような課題で、どのような主体とともに行うかという議論であるべきです。あるいは企業の議論でもいわゆる「オープン戦略」といって、自らの技術を囲い込むのではなくて広くオープンにして様々な連携を図る方が、そのエコシステムは永続的であるということもあります。そうした観点から、このオープンデータについて評価すべきかと思います。

またご質問は、使ってばかりでそれは果たして望ましい姿なのか?という視点も入っているのかと思いますが、それは一定ライセンスのところで整理がついていると思います。
ライセンスでは、表示するように指定する、あるいは元のライセンスを継承していく使い方を指定することができます。そこには、それぞれの取り組みをリスペクトしましょうという根本思想があって、そこにフリーライドの話は当然含まれていますが、どのようにこれまでの著作権の考え方から少しでもデータが使いやすくなるのかを考えてきたという取り組みも含めて考えることが必要だということですね。

Q 活用という意味では、まだあまりないということかと思うが、提供する側にも活用をどのようにすればいいのか、という情報提供はされているのか。ともすれば「提供しておけばいいでしょ」という話になりがちな気もする。

A そういう意味では、「何されるか分からないものにどれだけお金かけるのか」という議論はあります。ヨーロッパ式の考え方に行かないとしても、基本法で言うことを矮小化することもできます。

また、自治体が取り組むポイントとして「地域の課題を解決する視点」というのがありました。これがネックになることだと思うのですが、それは「課題解決するようなオープンデータってあるのか?」という話になります。

「そういうことを考えるためには全て公開すべき」という考え方もあれば「段階的にやればいいじゃないか」という考え方もあります。私は、授業で説明したとおり、それを先に決めていてはそれぞれが実は難しい実現のやり方をとっていると思う訳で、本当はそれほど難しいことではないと思うのです。それは実際にどのようなデータをどう使っていくかについて議論しながら考えましょう。
つまり、基本指針が「地域課題解決」を取り上げていることで、それに向けてどのようなことをしていけばいいのか、という実際上難しい議論をしているのではなくて、あくまで「なぜ?」のところを議論を、そのような難しい「地域課題解決」という議論で代替してやっている側面が大きくて、あまりそこは生産的な話ではないなと思っています。

分かりにくい説明かもしれませんが、ご質問のような問題意識を持っていただいた上で、次回以降の授業を通過して、どのようにご自身の考えが深まっていくかということに着目していただくと、いいのかなと思います。



この記事が気に入ったらサポートをしてみませんか?