見出し画像

ソーシャル・データ活用に見る未来

デンマークは、言わずもがなの先進デジタル社会である。世界に先んじて社会の隅々までデジタルが浸透する社会となることで注目されるのは、いかに便利なデジタルツールがあるかなどの表面的な部分だけではなく、デジタルインフラがあるからこそ指数関数的に社会に広がるイノベーションの種なんじゃないかなと思っている。

データは宝の山か?

データは次世代の石油、と言われて久しいけれども、実際にデータを活用して産業が勃興したり、ビジネスが生まれるというところまで行き着くのは時間がかかる。高品質のデータが継続的に蓄積されているデジタル先端国家デンマークでも、まだ行きついていない。

例えば、コペンハーゲンでは、データ交換プラットフォーム(データのマーケットプレイス)が提案されて動き始めたけれども、民間企業はデータを提供せず、また購買しようとする組織なども出てこなかった。だから、鳴り物入りで進められたデータプロジェクトだけれども、データ交換プラットフォームはまだ時期尚早であると判断され、2年で終了してしまった(詳しくはこちらを参照)。

バズワードにもなっているBig Dataは、どんな社会問題でも解決してしまうような魔法なんかではないのに、多分、期待されすぎだ。Big Data・Deep Dataといっても、多くのデータがあればいいという単純なことではないからで、単にデータがあるだけでは、実はなんの役にも立たない。機械学習に放り込んで何かしら宝探しをするということがうまくいくと考えたら大間違えだということを、そろそろ多くの人に気づいて欲しい。

データを次世代の石油にしたいのであれば、なによりも、データは正確であること、定期的に更新されていること、取り出しやすいことなどの諸条件を満たしている必要があるし、それがハイクオリティである必要がある。そしてなんのためにデータを使うのか、使いたいのかと言う目的も必要だ。

単に「集めたデータ」というだけで「あたり」が全くついてない場合は、ビックデータ分析しようとしても何も出てこない。偶然何か見つかると言うこともあるだろうし、逆に、世間に出回るビックデータ周りの話題はそんな話ばかりだ。けれども、たいてい何か見つかる時には、偶然ではなく、必然誰かの勘が裏で働いているんじゃないかと思う。

コペンハーゲン大学のソーシャル・データ・サイエンス:Social Data Science

最近、コペンハーゲン大学のソーシャル・データ・サイエンス修士プログラム(Master of Science (MSc) in Social Data Science in Copenhagen university)について知る機会を得た。 

このプログラムは、コロナ直下の2020年夏に始まり、この夏に第一期修了生を出している(修士は2年間)。記憶があやふやだが、確か1年目は30名、3年目の今年は60名の入学者だ。

計画経済デンマーク」で学生数を倍増させられるということは、学生の希望だけではなく、政府や大学、社会(企業など学生の受け皿)が承認する必要がある。そう考えると、この短期間にそれだけ社会的に認知されたということは、驚くべき成果と言ってしまっていい。ひとまず成功と考えられているということを示すかのように、修了生の就職先も引く手数多で、公共機関、民間でもコンサルなどの魅力的な戦略系分野に職を得られる、売り手市場だ。中には諜報機関や軍事関係に就職した人もいるんだそうで、期待度が透けて見える。

SOcial DAta ScienceでSODAS(そーだす!)

日本にも、データサイエンスのプログラムがあるようだけれども、社会で生み出されたデータを社会でいかに活用するかという「社会性」をきちんと把握して作られたプログラムは私の知る限りまだないし、欧米でもまだLondon School of Economics and Political Science(大学院修士課程)、University of Oxford(大学院修士課程及び博士課程)、University College Dublin(学部および大学院修士課程)、香港大学(学部)などにあるぐらいで、比較的新しいプログラムに位置付けられる。

そして、最初の話に繋がるが、そもそも適切な大量のハイクオリティ社会データが収集できなくては意味がないから、活用できる社会は、まだそうそう生まれてないと言えるんじゃないかと思う。

そんな意味でも、デンマークは、社会のあちこちでハイクオリティのデータが50年分ほど蓄積されて、データ収集の自動化が社会の隅々にまで広がりつつある現状を鑑みると、ソーシャルデータサイエンスを活用可能な社会ポテンシャルがこれ以上高い国は(中国以外)ないんじゃないかと思う。

プログラムがができるまで

Social Data Scienceプログラムの構想が始まったのは、2011年である。10年も前だ。シードマネー7500ドルを得て社会学、文化人類学、経済学、心理学、政治科学、パブリックヘルスの学部が集まって、研究プロジェクトを実施することになったそうだ。2012年から16年にかけて実施されたSocial Fabricプロジェクトで、工学系学生1000人に携帯電話を無料貸与し、データ収集を実施。複数の注目論文を排出することになった。

初期のプロジェクトの一つ

その研究は、データを用いたネットワーク分析という基本的なものから、社会データを活用して突発的な社会的な集団形成を促すなど多岐にわたる。具体的には突発的なパーティを計画して成功させるという遊び心に刺さるものだが(未確認)、データを活用することで大量の人を動員できる可能性を示したという意味で驚異的である。

人的ネットワークを追跡

このソーシャル・データ分析による研究がデンマーク政府の目に留まり、2016年には、研究規模拡大のための資金、150万クローネを追加獲得した。そして、2022年の現在、25名の教員の集う2000万クローネの年間予算を配分される一大研究グループに成長している。

産まれたてほやほやプログラム内容

プログラムは、学際的な構成になっている。生い立ちからもわかるように社会科学が母体となっており、心理学・政治学・人類学を始め様々な分野の知見が集約され、機械科学(コンピュータサイエンス)の研究者も関わっている。プログラムは、定性データ(エスノグラフィー、コンテンツアナリシス)、社会学(倫理、法律・政治、社会学理論、Science &TechnologyStudies )、社会学手法(実験、ネットワーク論)、データサイエンス(パイソン、機械学習、AI )の4つの核で構成されている。

データ処理関連の必須授業においては、デンマーク工科大学の機械科学も関与していて、オールデンマークの先鋭チームでソーシャルデータサイエンスを盛り立てようとしているようだ。そして、デンマークらしく、今後広く議論されていくようになるだろう社会データ倫理やプライバシー、セキュリティに関する授業も必須授業になっている。

修士プログラムへは広く門戸が開かれている。定量データを扱ってきた学部学生(心理学や理系学生)も、定性データを扱ってきた学部学生(社会学系学生)も受け入れる。それぞれが歩み寄り相互に学ぶことで、新しいソーシャルデータサイエンスに必要なスキルが身につくという考えだ。

プロジェクトにはどんなものがあるか?

修士プログラムを卒業し、今、博士プログラムを始めたばかりという学生がプロジェクトを紹介してくれた。そのプロジェクトは、ツイッターデータを収集してCOVIDに関するオンラインディベートを分析するというもので、ある意味、今までのデータサイエンスで「ありがち」な研究だ。ありがちだからこそ、とてもわかりやすい。

博士学生が時間を割いて研究を紹介してくれた

そして、ありがちとはいえ、学部で社会学を学んできたという学生が、2年間でプログラミングを習得し、自分のものにして、データ収集分析をしているという点にプログラムの可能性を見たし、社会学者が興味を持つことを実直に実施したという意味で今後を期待させる内容ではあった。

ただ、きっとソーシャルデータサイエンスの真髄は他のところにある。紙ペラ一枚で粒度低く説明してくれた実施中のプロジェクト例には「Copenhagen Network Study」なるものもあり、長期に学生のスマホデータをトラッキングし、地理データ(GPSやWifi、ブルートゥース)およびデンマーク統計局のデータと連携して分析するなども行われていることが窺われる。

おそらく、いくら丁寧に教えてくれたとはいえ、研究途中で外部(どこの誰かわからない私のような人)に発表できるような社会データ研究はかなり限定されるだろうから、ちょっとでも紹介してくれたことに感謝しないといけない。特にデンマークのセンシティブデータを使っている場合は、私のような外部者においそれと話すわけにはいかないということも理解できる。

ここで、きちんと理解しなくちゃいけないのは、デンマークにおいては、60年代から蓄積されている市民の医療データが、(外には出てきにくいが)研究に使われていることは、デンマークに住んでいる人は皆知っているし、そのほか個人の納税データ社会保障関連データも蓄積されている。GEOデータもオープンデータになっているし、国勢調査をはじめとした統計局のデータは膨大であり、中には自動化収集されているデータも多々現れつつあることを忘れてはいけない。

ソーシャル・データ・サイエンスができること。そして課題。

もちろん、社会における個人データが次世代のオイルといわれようといまいと、データをうまく活用しようという話は、実はそれほど単純なことではないと多くの人が気づき始めている。日本ではまだまだ注目が低いかもしれないが、データ、特に行動データや社会活動データなど「社会」における個人に関わるデータは、プライバシーや自己決定権や自由や民主主義などと大きく関わってくる問題だからだ。

トロントのSidewalk Labの衝撃は、たとえプラットフォーム巨人企業であっても、社会データの活用は、それほど簡単なことでないことを示している。自分の問題として考えてみても、自分の街での生活データをどこまで国や自治体に委ねるか、街のインフラを整備するプラットフォーム企業に売り渡すのか、自分のデータをアセットとして第三者に売り渡すのか、そして、売り渡した時に2−30年後の影響はどのようなものなのか、頭を悩ませる課題が山積している。

議論を巻き起こしたSidewalk Labの提案

こんなお宝を手にして、デンマークにいる社会データ研究者が何もしてないわけがない。そんなソーシャルデータサイエンティストが毎年60人輩出されるエコシステムを既に機能させているデンマークは、今後どんな方向に向かっていくのだろうか。

多くの日本人が、社会データの社会的重要性に気がついた時には、デンマークが100歩先を進んでいるんだと思うと、いろいろと歯痒くて仕方ない。

この記事が気に入ったらサポートをしてみませんか?