見出し画像

つながるデータのつくりかた

コロナ禍の影響と総理が変わったことで急激に行政のデジタル化の議論がにぎやかになってきました。

もうかれこれ20年近く行政ITに関わっている身としては「やれやれやっとか」と思わなくもないものの、とりあえず歓迎すべき動きだなと思って見守っています。

その過程で各自治体でバラバラに作られたシステムを統一とか標準化とかいう言葉がチラホラ聞こえてきますが、個人的にはアウトプットのアーキテクチャのことよりも、そのベース部分で相互運用性を保つためにどんなデータの持ち方をするのかという方が気になっているところではあります。

すごーく大昔、私は行政のウェブサイトにデータが散らばっているのはわかっていても、リレーショナルデータベースみたいなものでは行政の中で連携させたデータを作るのは無理!とずっと思っていました。

そんな中で出会ったのがオープンデータという活動と、Linked Dataという仕組みです。
Linked Dataとは、一つのデータを「主語・述語・目的語」の基本構造をベースにしてつなぎ合わせていく「グラフ構造」というデータの在り方ですが、これを知った時に「あ、これなら行政の超こんがらがったデータの整理もできるわー」とピンと来たことで、育なびnetのような様々な子育て関連情報を集約して子どもの生年月日と郵便番号でパーソナライズするというサイトを思いつくきっかけとなった…というのは、以下の調査季報に書いていますので、ご興味があればお読みください。

国の方でもこのデータ構造に着目していたこともあって、その後私も共通語彙基盤の活動に関わることとなりますが、個人的には一人の人間が持つ情報は、ライフイベントごとに「連なる(Linked)」のが普通なので、13桁のID(マイナンバー)を中心に集約されていくのが一番自然だろうと思っているところです。

Linked Dataの作り方は一見難しそうですがとても簡単です。
まず自分のID(13桁のマイナンバー)を紙の真ん中に書きます。
そしてそこから伸ばすようにして自分が持つ属性を書いていってみましょう。
例えば、氏名、誕生日、現在の住所、性別、卒業した学校、趣味などなど。
さらに現在の住所を真ん中に郵便番号や都道府県などをさらに付加していきます。
そうするとこんな感じの図が出来上がるはずですが、これがLinked Dataの姿です。(ほんとはここから別のデータベースにどんどんリンクさせていくとかあるのですが、ややこしいので今は省略)

データベースというとExcelみたいな表形式を思い浮かべる人が多いと思いますが、人間は生きて活動する上で様々な情報が付加されていく生き物なので、個人的にはこういう「育っていく」データを使うのが普通だよなぁと思っているところです。

サービスを構築していくにあたり、IDやデータの運用性がどのようになるかはその後のサービスの質を左右する重要なファクターになるはずなので、「生きている人間」を正確に表現し続けられるデータの仕組みと、それを適切に開いていくAPIの考え方がこれからの行政サービスには必要なんだろうなと思っているので、今後もこれらの動きを注視していきたいと思います。

よければサポートお願いします!めっちゃ励みになります!