見出し画像

監視資本主義はディープテックスタートアップにとってビジネスチャンスとなるか?

こんにちは、ANRIでインターンしている博士@nashi_budo_)です。
今この記事を読んでくれているそこのあなた、実はあなたが誰か知っています
あなたが何を考えているかも丸わかりです。

と言われたらぞっとしませんか?

今回の記事では、世界的に注目を集め始めてきている個人情報の流出問題を取り上げ、個人情報を巡って今何が起きているのかお話します。そして、このような問題を技術的に解決していく方法やそんな技術を使ったスタートアップを紹介していきたいと思います。
現在、特にヨーロッパ・アメリカで大変問題になっている個人情報の取り扱いですが、これから問題が全世界へと波及し、ビッグテーマになっていくと確信しています。そして、この状況はスタートアップにとってビジネスチャンスです。
新たなビジネスモデル・技術が生まれる時代がやってくるのではないでしょうか?

早く技術について知りたい方は「技術で解決する方法とは?」の章から読み始めてもらえればと思います。

日常に潜む監視資本主義

突然ですが、今どんな検索エンジンを使っていますか?
Google chrome? Safari? Firefox? Duckduckgo?
何で検索しているか意識せずに検索エンジンを使い、アプリをダウンロードし、 知らず知らずのうちにネット検索しているあなたへ。あまりに精度の高いターゲット広告を目にし、怖くなった経験はないでしょうか?誰かが自分のことを観察して、情報を使っているのではないかと考えたことはないですか?

TwitterやInstagram、FacebookといったSNSがもたらす悪影響を、実際にそれらのサービスに従事していたエンジニアたちの告発を基に描いたNetflixオリジナルドキュメンタリー『監視資本主義:デジタル社会がもたらす光と影』を見て、下記の言葉がすごく印象に残っています。

"If you're not paying for the product, then YOU are the product."
もしあなたがタダで商品を使っているなら、そのときはあなたが商品なのだ。

facebookなどのSNSは、利用者ではなく広告主から収益を上げます。このとき、広告主に売る商品とは「ユーザー」であり、ユーザーに与える影響(=広告効果)の最大化が目標です。広告効果を最大化するために、ユーザーがどんな習慣を持ち、何を好み、何を考えているかを監視し、予測し、それに基づいて最適な効率でその行動を操作します。そういう意味で監視資本主義なんですね。監視資本主義と言う言葉は、ハーバード大学ビジネス・スクールのShoshana Zuboff名誉教授が作った造語で、2019年の発売以来アメリカのメディアで高い注目を浴び続けている『監視資本主義の時代』(原題:The Age of Surveillance Capitalism )に出てきます。


世界で何が起きているのか?

Facebookの個人情報流出事件
巨大プラットフォームが織りなす監視資本社会の脅威を人々に知らしめた事件として2018年に起きた「ケンブリッジ・アナリティカ事件」が有名です。データマイニングとデータ分析中心に政治コンサルティングを行っていたケンブリッジ・アナリティカ社がFacebookのAPIを経由し数千万人分のユーザー情報を取得、その情報からターゲティング広告を表示し、2016年のブレグジットやアメリカ大統領選挙において浮動票を大きく動かしたとされています。この問題は大きく報道され、訴訟でFacebookのCEO マーク・ザッカーバーグ氏も大筋を認め、欧州議会で釈明する事態へと発展しました。
(Facebook-Cambridge Analyticaのデータスキャンダルをきっかけに、約40万件の#DeleteFacebookのツイートがありましたが、皮肉なことに同期間にFacebookのアクティブユーザーは約4%増加しました。)

RobinhoodのPFOFビジネスモデル
掲示板Redditに集まる個人投資家たちが、倒産危機にある大手ゲーム小売店「ゲームストップ(GameStop)」の株価を暴騰させ、ヘッジファンドに巨大な打撃をもたらした事件は、様々な議論を引き起こしました。
今回の騒動では、個人株式投資家が結託して株価操作的な行動に注目が集まりました。一方で、庶民の味方として手数料なしでこのような個人株式投資家が簡単に株式取引できるアプリを提供するRobinhoodのPFOF(payment for order flow)というビジネスモデルの妥当性も見直されることになりました。
PFOFは、証券会社が顧客からの注文を機関投資家であるHFT(高速・高頻度取引)業者などのマーケットメーカーに回し、それと交換に報酬を受取る仕組みのことです。そのため、個人に対して手数料をゼロにできるというビジネスモデルが成り立ちますが、このようなビジネスモデルを個人投資家が理解して使用していたかどうかは疑問が残ります。

各地で活発化するプライバシー保護活動

EUはデータ・プライバシー運動の先駆者でしたが、米国の政府・各州もこれに追随する動きを見せています。米国カリフォルニア州司法長官室は、「カリフォルニア州消費者プライバシー法」を今年の1月に施行し、他の多くの州ではデータ・プライバシー法案が提出中ですが、米国連邦政府もこの法案に乗り出しました。さらに、アメリカの多くの企業がターゲティング広告などの自主規制を始めました。

データプライバシーテックの台頭とビジネスチャンス

Data is the 21st century’s oil, what's next?
消費者である私たちは、「無料」サービスと引き換えに個人情報を気づかないうちに少しずつ渡し、快適さを手に入れてきました。GAFAMのようなアメリカのテクノロジー企業は少しずつデータを収集し、それらのデータを駆使することで莫大な富と力を獲得してきました。
その一方でデータ保護に関する技術や人々のリテラシーは追いつかず深い溝が顕在化してきました。
例えば、 2018年だけでも、約5億件の個人情報記録が流出しました。この5億件にはパスワード、クレジットカード番号、その他の比較的平凡な生活の一部だけでなく、医療検査結果、位置情報、自宅住所、その他あらゆる種類の深い個人情報も含まれています。
これから問題がさらに顕在化するにつれ、データプライバシーテックは一般用語として広く認知されて行くと思います。技術、法律、倫理など様々な分野からのアプローチが必要となっていくでしょう

新分野の台頭
データプライバシーテック
に参入する企業が増えていることがグラフからわかります。その数は3年間で5倍以上に増え、評価額が10億ドルを超えるユニコーン企業(OneTrust)も出現してきています。
一般消費者のプライバシーに対する意識が高まり、新たなビジネスの必須条件となっていきます。それに伴い、企業も個人もプライバシー保護ビジネスに代価を支払うことになり、新たなビジネス領域が生まれます。

図3

技術で解決する方法とは?

プライバシー保護技術として、エッジコンピューティング、秘密計算、差分プライバシー、連合学習など様々な技術があります。Apple、Google、Microsoftなど、より多くの企業が、データ利用は継続しながらも利用者に(数学的な意味で)厳密なプライバシー保証を与える、差分プライバシー(Differential Privacy)の手法を導入しつつあります。また、データプライバシーを牽引してきたPrivitarは、差分プライバシーや部分準同型暗号を駆使しつつ、金融サービスやヘルスケアなどの規制業界の大企業を顧客として売上を伸ばしているスタートアップです。
今回は従来の機械学習が持つ弱点を克服し、新たな深層学習の手法として近年注目を浴びている連合学習(Federated Learning)について説明します。
他の秘密計算や差分プライバシーなどの興味深い技術も今度記事として投稿できたらと思います。

連合学習(Federated Learning)
技術

秘密計算や差分プライバシーはプライバシーを保護しながらデータを解析する技術ですが、データそのものを保護するのではなく、複数組織にまたがるデータをもとに機械学習の精度を向上させることが目的の場合に適用される技術として、連合学習が注目されています。
この技術はGoogle社が2017年に発表した深層学習の手法です。通常、訓練データからモデルを作成するときには、分散しているデータを中央に集めると思います。しかし、連合学習では分散している訓練データに対して、まず機械学習の共通モデル(マザーモデル)を配布し、各サイトで独自訓練データを用いてマザーモデルを更新、更新前と更新後のモデルの差分をマザーモデルに返すことで、マザーモデルをアップデートすることを繰り返します

図4

具体的に言うと、各自の携帯電話端末からデータを抜き出さずに、マザーモデルを構築する技術のことです。携帯電話は既存のマザーモデルをダウンロードし(A)、ユーザーの個人データを使用してローカルでモデルをトレーニング(B)、学習した重みを抜き出し(C)、暗号化して通信します(D)。他の携帯電話のすべてのモデルを平均化し(E)、アップデートとして(F)共有することでマザーモデルパフォーマンスを向上させ、これをまた各携帯電話に配布します(G)。

図5

2020年7月に投稿された論文では、MRI画像から健康な脳組織とがん性の脳組織を区別する研究において、連合学習は従来のデータ集約モデル「Centralized Data Sharing」と同等のパフォーマンスを発揮することが報告されています。
また、2020年10月の論文では、マザーモデルアップデートするこれまでの仕組みから、完全な分散型「Decentralized Federated Learning」も検討され始めています。

技術で解決するスタートアップ

Owkin(Founded at 2016, Total Funding $74.1M)
概要
この連合学習技術を使ったスタートアップにOwkinがあります。複数の病院をまたがって連合学習による分散トレーニングを行い、病院間で個人情報を共有することなく、堅牢なAIモデルを構築できるプラットフォームを開発しているスタートアップです。
製薬会社は病院のデータにリーチしたいができていないというペイン、そして病院側はデータを活用したいが個人情報を含むためにうまく活用できていないという双方のペインがありました。

画像4

顧客のメリット
・病院はデータを提供する必要がない
・大量の同質データにリーチできる
・精度の高いモデルが作成できる


ビジネスモデル

図6

ビジネスモデルとしては、Owkinのデータサイエンティストがマザーモデルを作成して、学習して得られた結果を製薬会社に提供し受託料を頂戴します。
これによって、製薬会社は今までリーチできなかった各病院に散らばっている難病患者のデータにモデルを通してアクセスすることが可能になりました。

現在Owkinはフランスの大手病院や製薬企業とパートナーシップを締結し、GVやBpifranceなどから資金調達を受け、事業を拡大しています。

まとめ

今回の記事では、これからさらに重要になってくるであろう個人情報問題を取り上げ、連合学習などの新しいプライバシー保護技術がどのように問題を解決し、スタートアップとしてビジネスと結びつくのか具体的な企業を紹介しながら解説しました。
大きなペインがが見つかったときこそ既存の手法・企業のやり方をディスラプトして、新たな時代を切り開かれると思います。プライバシー保護に対する意識が日本でも浸透し、プライバシーテックスタートアップがこれからたくさん出てくるのではないかと楽しみです。

本当におまけ

下記は、Q&AサイトQuoraでDuckDuckGoの収益モデル(2008年9月創業で2014年以降は黒字)についてDuckduckgoのCEOが自ら熱く答えていて面白かったので、時間があるときでも読んでみてください。


参考文献は多すぎて見にくかったのでこちらのリンクにまとめました。

起業相談・資金調達に興味がある方は、コンタクトフォームからお気軽にご連絡ください!
博士の学生や研究者の方で、自分の研究が事業化できるか分からないけど相談してみたい、ディープテックスタートアップの成功事例を知りたい、壁打ちしたいなどありましたら、お気軽に私にDMで連絡ください(もちろん、博士の学生や研究者以外の方でも大歓迎です!)。お待ちしております!

この記事が気に入ったらサポートをしてみませんか?