見出し画像

データ整備にはツールが重要

データ駆動社会といわれていますが、AIが出てきてさらにデータの重要性が増しています。
データの連携や利活用をしやすいようにデータモデルなどを政府相互運用性フレームワークで整備してきましたが、データモデルは所詮はルールにすぎません。
これを実装するのにスキーマやツールの提供をすることが有効です。

スキーマの提供

これはやらなければと考えていますし、デベロッパーの方々からも要望があるのですが、まだ提供ができていません。schema.orgのようにコミュニティ化して検討することも考えたほうがもいいかもしれませんが検討中です。

ツールの提供

こちらが先行して取り組んでいます。ルールやガイドラインを普及させるにはツールとセットで提供することが有効で、米国や欧州ではルールやガイド整備とともに常にツール整備が並行して行われています。
一方、日本では多くのルールやガイドなどが出ているもののツールの整備までいかないものが多く、ツールがあってもチェックリストなどです。そのためルールやガイドなどの普及がなかなか進みません。

米国の例

米国政府のデータ基盤のNIEMでは、データモデルを活用するためのツールカタログが提供されています。実装モデルの作成支援ツール、モデルの管理ツール、検索ツール、EAI等が官民から提供されており、リスト化されています。
民間のツールも紹介することで普及促進を図っていますし、民間の創意工夫を活かせる仕組みとして有効に機能しています。
NIEMのデータモデルがUMLで組み込まれるなどの工夫がされており、NIEMのデータモデルを使って簡単にサービス開発や連携ができるようになっています。

欧州の例

欧州委員会のデータ基盤であるSEMICはSEMIC Support Centreの中でToolkitのページを作り基本ツールの情報提供を始めています。(最近作ったページなので主要ツールのみ掲載されています)
これ以外にも様々なツールが提供されており、カンファレンスなどで、各国や民間が作ったツールが積極的に紹介されています。

日本の取り組み

日本は、データ作成や変換のためのIMIコンポーネントツールを提供したりしてきましたが、官主導のツールは単年度予算で作ることが多く、継続して改善することが難しく、そのため普及も活用も十分に進んでいませんでした。

そうした中、民間の取り組みとして2023年3月にMicrosoft Power Platform向けのデータ基盤Microsoft DataverseでGIFのデータモデルのテンプレートが提供されました。
これによりGIFとか知らない人もサービス開発するときに簡単にデータモデルを使えるようになります。ローコード、ノーコードが流行っていますが、サービス構築時にはデータの定義をすることは必須であり、そこを支える仕組みとして非常に有効であると期待しています。

日本もやっとここまで来たかという感じで、今後も民間のツール群に組み込まれていくことを期待しています。

また、データ連携の部分では、エリア・データ連携基盤推奨モジュールgbizconnect-nodeを提供するなどツール提供が進み始めています。こうした取り組みを加速するには、開発を促進する技術コミュニティを拡大していくことが重要と感じています。

まずは、国内外で使えるツール群をリストアップするところからスタートしたいですね。

参考

今回のマイクロソフトの取り組みは、以下の記事を是非ご覧ください。

データ駆動社会に向けてデジタル庁が取り組む、「政府相互運用性フレームワーク“GIF”」の全貌

デジタル庁整備のデータモデルをMicrosoft製品に実装、自治体データ連携進むか(日経クロステック会員向け)

この記事が気に入ったらサポートをしてみませんか?