見出し画像

オープンデータから日本全国の人流をつくりだす

mdxを利用した研究の紹介2
オープンデータから日本全国の人流をつくりだす

東京大学デジタル空間社会連携研究機構 機構長
東京大学空間情報科学研究センター 副センター長・教授 関本義秀

早くから「人流」の重要性に着目

 新型コロナウイルス感染症との関連で「人流」という言葉が広く知られるようになりました。しかし、私たちが「人の流れプロジェクト」を始めたのは、それよりずっと前の2008年です。人々が時々刻々移動していく有様をとらえた人流データは、防災や防犯、マーケティング、交通・都市計画などに役立つだけでなく、さまざまな分野の研究者にとって重要なデータインフラとなります。そのため、人流データを作成・提供するプロジェクトを開始したのです。
 これまではおもに、パーソントリップ(PT)調査(国や地方自治体などが行う交通アンケート調査)のデータを処理することで人流を再現してきました。この人流データは共同研究を通じて提供しており、その件数は400件近くに上ります。
しかし、PT調査は大都市圏などでしか行われておらず、日本全国の人流を描き出すことはできません。一方、携帯キャリアとの共同研究で、スマホの位置データから人流を得る試みもしましたが、位置データは個人情報のため、得られた人流データを他の研究者に提供するわけにはいきません。こうしたフラストレーションを抱える中で、「オープンデータを利用することで、日本全国の人流を擬似的につくりだしたい」と考えるようになり、mdxを使って実行しました。

オープンデータから必要な情報をつくりだす

 擬似人流をつくりだすために、「エージェントモデル」という方法を使いました。大まかな手順は以下の通りです(図)。
 ①まず、コンピュータの中に日本の総人口(約1億3000万人)分の仮想的な人間(エージェント)をつくり、各人の年代や性別、家の場所を決めます。②次に、各人の通勤・通学の有無と平日の行動パターン(例えば、通勤者の場合、「家↔勤務先」「家→勤務先→第3の場所」など)を決めます。③さらに、各人の具体的な行き先を決めます。④その上で、行き先までの距離、最寄り駅へのアクセスなどから交通手段を選び、各人の1分ごとの位置を割り出していきます。これをすべてのエージェントについて集めれば、日本全国の擬似人流を描きだせるというわけです。
個人情報が含まれていないオープンデータから、どうやって各人の属性や行動を決めたのでしょうか。私たちは、使えそうなデータを探し集め、その処理方法を徹底的に工夫しました。例えば、国勢調査には地区ごとの年齢・性別構成の統計がある一方、地図情報会社が提供している全国の住宅位置データ※1 があります。これらを組み合わせることで、どの家にどの年代・性別の人が住んでいるかを推定しました。また、私たちはPT調査から人流を導いた際に、人々の行動パターンを分類し、それぞれの割合を明らかにしていました。②の段階では、このデータを用いて各人の行動パターンを確率的に決めました。こうしたことの積み重ねで、かなり現実に近い属性の1億3000万のエージェントをコンピュータの中につくりだし、行動させることができたのです。
 手順のうち④の段階は多くの計算資源を必要とするのですが、mdxを使ったことで順調に計算でき、2021年度に擬似人流第1号ができあがりました。この擬似人流は、大きなメッシュで見れば、スマホの位置データからの人流と比べても遜色ないもので、すでに研究者へのデータ提供も開始しています。今後もmdxを使い、②の行動パターンをきめ細かくするなどして、より精度を高めていきたいと考えています。

(取材・構成 青山聖子)

オープンデータから擬似人流を作成する手順

※1 有償だが安価であり、誰でも利用できる。

関本義秀/専門は人間都市情報学。東京大学大学院工学系研究科博士課程修了、博士(工学)。国土交通省国土技術政策総合研究所研究官、東京大学空間情報科学研究センター特任准教授などを経て、2020年より同センター教授、2022年より副センター長。2021年より東京大学デジタル空間社会連携研究機構機構長。

深く学ぶには
「人の流れプロジェクト」https://pflow.csis.u-tokyo.ac.jp/

Contents
巻頭言
特集 データ活用社会創成プラットフォームmdx 始動
  ゼロカーボンを目指す地域と技術をつなぐ情報基盤の構築
  オープンデータから日本全国の人流をつくりだす
  医学分野の論文から日本語言語モデルを構築する
連載 nodesの光明
  情報システム利用者の「困った!」を解決
   ──教育のオンライン化に貢献する学生サポーターたち
連載 飛翔するnodes
  大型データから解き明かす土星衛星の大気環境
nodesのひろがり
  
プロジェクト md“X”
  スパコン導入の舞台裏
  0と1で超巨大システムを操る
  モノとその繋がりの科学

この記事が気に入ったらサポートをしてみませんか?