見出し画像

【最速解説】「こどもに関する各種データの連携による支援」成果報告書

今回は、いつもそれなりに需要(アクセス)がある最速解説シリーズです。
デジタル庁がやっている「こどもに関する各種データの連携による支援実証事業」に関する成果報告書が、4月28日にUPされていたので、その解説をやってみたいと思いますー。

こどもに関する各種データの連携の背景

そもそも「こどもに関する各種データの連携」って何か?
元を辿ると2022年6月7日に閣議決定された「デジタル社会の実現に向けた重点計画」となるようです。

上記の重点計画において、こどもに関する現状認識と対応策について、以下のような記載があります。

現在、こどもを取り巻く状況として、貧困、虐待、不登校、いじめなど、様々な課題が指摘されている。例えば、平成30年(2018年)の「子どもの貧困率」は13.5%となっており、平成24年(2012年)の16.3%からは減少傾向にあるものの、依然として改善が必要と考えられる。(中略)こどもに関する教育・保育・福祉・医療等のデータについては、地方公共団体内でもそれぞれの部局で管理されているとともに、児童相談所・福祉事業所・医療機関・学校等の多様な関係機関があり、それぞれの機関がそれぞれの役割に応じて、保有する情報を活用して個別に対応に当たっている。こうしたこどもや家庭に関する状況や支援内容等に係るデータを分野横断的に最大限に活用し、個人情報の適正な取扱いを確保しながら、真に支援が必要なこどもや家庭を見つけニーズに応じたプッシュ型の支援を届ける取組は、こども一人ひとりの状況に応じたオーダーメイドの社会的な課題の解決を可能とし、こども一人ひとりが夢や希望を持つことができる社会の実現に資する。

デジタル社会の実現に向けた重点計画」P80

子どもに関するデータは自治体や学校に保存されているが、散らばっていて総合的な状態把握や分析がしにくい状態にある。しかも本当に困っている子どもや家庭こそ、自ら支援にたどり着くことができないことも多い。
なので、散らばったデータを連携して状態を総合的に把握できるようにし、行政等は「待ち」の姿勢ではなく、能動的な「プッシュ型(アウトリーチ型)」の支援をやっていこう、ということのようです。

上記を実現するための諸々の調査と、実際にいくつかの自治体で実証的にやってみよう、というのが「こどもに関する各種データの連携による支援実証事業」という感じのようです。

私もデジタル庁職員の端くれなので、中の人とも言えなくもないですが、実際は自分の隣の担当がやっている内容なので、ちゃんと分かっていなかったりします。
なので、報告資料を見て理解しながら書いているので、もし間違っていること書いていそうなら、担当の方は今度出勤したときにツッコミ入れていただけたらと(内部連絡)。

全体アーキテクチャで言うとどの辺り?

以前ご紹介した学校教育の全体アーキテクチャだとどの部分かと言うと、以下の辺り。

住民記録システム系と校務支援システムや学習系システムなどの情報を集約し、可視化したり通知(プッシュ)したりする部分。
一度アーキテクチャを書いておくと説明しやすくて良いですね。やっておいて良かった。
全体アーキテクチャについては気になる方は、以下をご覧ください。

事業のざっくり構造説明

まずはこの事業のスーパーざっくりの理解。以下の図みたいな感じ。

文字で箇条書きすると

  • 全国で7団体の自治体等でこどものデータ連携に関する実証する

    • 7団体ごとで成果報告書を作成

  • 7団体成果の横串でのとりまとめ、先行事例や法令等の調査を行う

    • データ項目ユースケース、データの管理方針、法令等対応、システム構成や進め方、事業評価方法等をまとめた成果報告書を作成

    • データ項目の細かい一覧を整理し、データ項目一覧を作成

  • 7団体の成果とりまとめを踏まえ、今後の実証事業に向けたガイドラインを検討委員会で議論

    • 実証事業ガイドラインを作成

    • 必要な個人情報の整理についてを作成

という感じです。太字が成果物。
この構造が分かっておくと、どの成果物がどんな経緯でどんなものっぽいのかの概要が少しイメージできるかも、と思っています。

個人的にポイントだと思った5つ

ざっくり構造説明の次は内容の詳細を、と思ったのですが、ざっと1時間ほど報告資料に目を通したり、分からん部分を調べたりしたのですが、ボリュームも多く、内容もかなり詰め込まれていて簡単に解説ができる内容じゃないですね…。
前述した重点計画やらこどもに関する情報・データ連携副大臣PTとか地方公共団体のセキュリティガイドラインだとか、ガバメントクラウドだとかを踏まえた解説をしないと、理解しやすいものを書けなそうです。
そうするとボリューム多すぎになりそうなので、勝手ながら個人的にポイントだと思った5つを取り上げてみたいと思います。

①こどものデータ連携をとりまとめる部署の決めが重要

こどものデータ連携って言うぐらいですから、各所に散らばっているデータを集めて分析することになります。そうすると、集めたデータを管理する部署を決める必要が出てきます。

「データ項目等にかかる調査研究」成果報告書より

上記の図だと「総括管理主体」の部分です。
データをまとめるのだから、そのまとめ役を決めるのは当たり前感あるかもですが、役所は縦割り上等なのでこれが結構難しそう。
この部署が司令塔になって、自治体としての全体方針やデータの活用の仕方・保護等のポリシーを決めて進めるのは、前提条件になりそうです。
データ連携の結果を活用する主な主体部署が総括管理主体になるのも手でしょうし、これを機に部署を設立する、という荒業もありそうです。

②データ項目や先行研究がまとめられている

とりまとめの結果、こどものデータ連携に関わるデータ項目と先行研究等の一覧が以下のエクセルでまとまっています。
20230428_news_children_outline_03.xlsx (live.com)

データの項目数だけ見ても7,266の項目を抽出しており、地方公共団体情報システムデータ要件標準仕様書政府相互運用性フレームワーク(GIF)特定個人情報データ標準レイアウト教育情報アプリケーションユニット標準仕様(APPLICのWebが定期的にオチているように見えているが大丈夫か?)との対応関係も分かるようになっています。
後述するデータクレンジングのためにも、標準が規定されているデータ項目については、この「こどもデータ連携」をやるタイミングで保存や処理、管理方法を見直しておくべき項目が分かりそうです。

また、先行研究のインデックスがあるのも個人的にはありがたい。

データ項目一覧より

いじめ、貧困、虐待・育児放棄、不登校というユースケースでカテゴライズされて、113の先行研究の論文等が記載されています。
うーむ、2019年以前の論文ならChatGPTで要約させて読んでおきたい。
ユースケースごとに見ていき、気になったもののタイトルを確認して、継続的に観測するデータが何か、などを探っておくと設計の役に立ちそうです。

③システム構成のパターンが分かる

こどものデータ連携のシステムってどこでどう作るのか、7つの実証を通じていくつかのパターンが見えてきます。

「データ項目等にかかる調査研究」成果報告書(概要版)より

7つの実証も大別すると、①標準形(戸田市・昭島市・尼崎市・府中町・福岡市)・②マイナポ系(加賀市)・③医療連携系(あいち小児)の3つとされています。
標準形についても、LGWAN接続NW上に配置する三層系(戸田市)・個人番号利用事務系NWに配置する二層系(昭島市・尼崎市・府中町)、データベースと計算基盤を別に配置するハイブリッド系(福岡市)の3つに分かれています。

実は前述した全体アーキテクチャのなかでも、こどものデータ連携に関するデータベースの置き場所は、ガバメントクラウドとパブリッククラウドのどちらにも大別していませんでした。この実証の通り議論が分かれると思って抽象化していたのですが、この辺りは予想通りな感じです。

加賀市はマイナポータルでの本人同意に基づくデータ提供という特徴的なアーキテクチャを選択してパブリッククラウドでこどもデータ連携を行っているようです。
今後、2023年3月に改訂された「地方公共団体における情報セキュリティポリシーに関するガイドライン」を踏まえてβ'モデル=ゼロトラスト型が構築されてくると、こどもデータ連携もパブリッククラウド化していく可能性もありそうです。
※自治体向けのガイドラインも解説しないとこの辺分からんですよね…。

④名寄せやデータクレンジングが大変

データを連携したとしても、IDによる名寄せができていないと横串で分析できないし、バラバラの項目や形式だと分析できないし、あると聞いていたデータがないと分析できない。
この手のデータ分析って、前処理が8割とか言われていますが、この実証でもまさにそんな様相です。

IDによる名寄せの必要性については、「国での議論を踏まえて学校教育における全体アーキテクチャを描いてみた」でも記載していますが、標準仕様をうまく組み合わせて名寄せしていくことが必要なのだと思います。

「データ項目等にかかる調査研究」成果報告書より

上記は各実証団体での名寄せで何の項目を使ったか、のまとめです。
今の国議論の標準仕様等を踏まえると、住民記録システム系+校務支援システムは団体内宛名番号、校務支援システム+学習系システムは学習eポータル標準モデルのUUIDを当てることが妥当そうです。
全体アーキに則る構成の場合、団体内宛名番号とUUIDの2つで名寄せができることになります(APPLIC標準で校務に対し宛名番号を入れる整理が追加で必要)。

名寄せだけでなく、それぞれのデータ項目でもバラバラ問題があり、前述したデータ項目一覧において、記載されている標準仕様に則り整理していくことでこのクレンジングの手間を大幅に削減でき、リアルタイムでの分析に近づくはずです。
また、データの欠損対応にも手がかかっている様子が見えています。校務支援システムに入っているとされていた出欠情報が入っていない、など「このシステムはこのデータを保持している」が必ずしもアテにならない=現場の運用に任されているシステムだとそうとも限らないということが見えているのは、机上検討ではなく実証ならではのように見えています。

⑤情報の取り扱いについてまとまっている

こどもデータ連携を進めるとなると、特に機微な情報を取り扱うことも多く、様々な部署が様々な用途で使うことが想定されるため、厳に注意して行っていく必要があります。
当然ながら、各部署にとって必要最小限の取り扱いにすることを前提とし、前述した総括管理主体によるデータガバナンスや、個人情報の適正な取扱い等が成果報告書や実証ガイドラインでまとまっています。

個人情報保護に対する検討事項(「データ項目等にかかる調査研究」概要版より)

以下のようなデータごとの保存期間例が出ているのなんかは、個人的にありがたいな、と思ったりしました。

「データ項目等にかかる調査研究」成果報告書より

データの削除とかを考えることって思いのほか難しく、こういうまとめがあるだけで、考え方や権限の整理がしやすくなります。

まとまっていないまとめ

ざっと個人的にポイントだと思う5点を書いてみました。
他にも具体的なユースケースやその分析手法、苦労話や施策評価方法なども詰まっていて、なかなか読みどころ多い報告書になっています。各実証地域のものまで目を通すとより発見もありそうです。

改めて、実施計画や成果報告などが提示されているURLを貼っておきます。

より詳細を資料以外で見たいという方は、成果報告会の模様があるので、動画で流し見したいという方はこちらもおススメです。

各学校設置者では、ダッシュボード機能など教育データの取り扱いについて検討が始まっているのだと思っています。
こどもデータ連携もその大事な1つですので、関わる部署の方は、これらの資料も一読してもらえたらと思っています。

おわりに

相当絞って書いてみたのですが、5,000字超の結構長いものになってしまいました。これ以上簡略化すると、事業の意図が伝えられなくなり、意味も分かり辛くなりそうなので、、なかなか難しいですね。

次回は何を書こうかしら。
予定が全然立っていないので、その場その場で書いてしまっています。
最近は本業が過労死認定の労働時間を軽々超える状況なので(苦笑)、次回ぐらいはお休みするか、少しライトなものになるかも、です。

ではまたー。

この記事が気に入ったらサポートをしてみませんか?