見出し画像

近年注目される合成データってなに?

はじめに

みなさん、こんにちは!GEOTRA経営企画部マネージャーの小島です。

本日は、GEOTRAが提供する、GEOTRA Activity Data(GPS位置情報とモデリング技術を活用した、生活者ひとりひとりの導線がわかる高粒度な人流データ)のコアとなる、「合成データ」についてご紹介します。

画像5
(GEOTRAにて作成)

合成データとは

合成データとは、現実世界のデータを元に作成される人工的なデータであり、パーソナルデータの新たな活用手法として、近年、大変注目をされています。英語では、Synthetic Data、別名Artificially Generated Dataとも言います。

業界最大規模のITアドバイザリー企業である、米国Gartnerは、「2024年までに、データ分析や機械学習の開発で利用されるデータのうち、60%が合成データになる」と予測しています。
また、ソフトウェア開発の最新情報、トレンド等を紹介する、Info Qは、ソフトウェア開発(機械学習、データエンジニアリング等)のテクノロジートレンドにて、注目すべき技術群であるInnovatorsの中に、合成データを掲載しています。

なぜ合成データが注目されているのか

なぜ、合成データがここまで注目されているのでしょうか。
前々回のnoteでは、昨今、内閣府が、政策の企画を、エピソードに頼るのではなく、明確な目的のもと、データなどのエビデンス(根拠、証拠)から確りと現状を把握したうえで進めようという、EBPM(Evidence Based Policy Making)を推進していることをご紹介しました。
EBPMを進めるにあたって、プライバシー保護の観点から、現実世界で得た生のパーソナルデータをそのまま利活用することは難しく、特定の個人を識別出来ないように、生のパーソナルデータを一定程度秘匿化、非特定化処理する必要がありました。
非特定化処理されたパーソナルデータは、統計処理や秘匿化処理を施されていることから、データ粒度が荒く、分析パターンが限られる、という課題がありました。

このように、パーソナルデータの活用には、プライバシー保護とデータ粒度の両立という大変難しい課題がありました。

画像5
(GEOTRAにて作成)

そこで注目されているのが、合成データというプライバシー保護技術です。

合成データは、コンピューターのアルゴリズムによって生成され、現実世界での統計的な特徴量を維持した、限りなく実際のデータに近い人工的なデータであるため、プライバシーの課題をクリアし、高精度かつ生データに近いフォーマットを利活用することが出来ます。

画像5
(GEOTRAにて作成)

合成データの活用事例も近年増加しており、特にセンシティブなデータを扱う、医療分野等での活用が進んでいます。

まとめ

本記事では合成データの概要、合成データが注目される理由について簡単にご紹介しました。
合成データの利活用は、多分野に於いて、どんどん進んでいくものと思われますので、要チェックです!


(補足)GEOTRA Activity Data

これまで、合成データについて、ご紹介しましたが、ここからはGEOTRA Activity Dataに関する簡単なご紹介です。

前段でご説明した通り、これまでの人流ビッグデータは、データ粒度とプライバシーのトレードオフという課題を抱えており、分析の自由度に限りがありました。
そこで、GEOTRAは、秘匿化・非特定化された、KDDI株式会社が保有するauのGPS位置情報ビッグデータや地図・交通データ、公的データ、POI (Point of Interest:地図上の特定の地点) データなどの情報と合成データ生成技術等を掛け合わせ、より自由度の高い分析や、将来予測に活用可能な人流データを生成・ご提供しています。

画像5
(GEOTRAにて作成)

GEOTRA Activity Data(=合成データ)によって、年代・性別・勤務地・居住地など様々な属性を持った、生活者ひとりひとりの移動履歴・導線を表現・再現することが出来、様々な切り口から、都市人流の傾向を捉え、可視化することが出来ます。
さらに、都市人流の未来予測、例えば渋滞予測や施設の混雑予測、災害時の想定人流などをシミュレーションすることも可能です。

画像5
(GEOTRAにて作成)

最後に

4回目の投稿となる今回は、GEOTRA Activity Dataのコアとなる、「合成データ」について、ご紹介しました。
今後皆様のお役に立てるコンテンツを配信できればと思っておりますので、少しでもご興味をもって頂けた方は、いいね or フォローをよろしくお願いします!

弊社へのお問い合わせ先
メール:sales@geotra.jp