見出し画像

データビジネスに参入する企業へ送る、プライバシー技術導入の手始め

AI技術でデータ処理を行う際にプライバシーに配慮した準備がこれから必要になっていきます。

インタビュー後半は、AIとプライバシー技術を組み合わせるためにどういった準備を行う必要があるのか聞いていきたいと思います。

画像1

開発者が確認するべき、プライバシーを前提にしたシステム設計4ポイント

Kohei: 今日、社会の様々な場面でAIに関する議論が進んでいます。どの企業も経営効率を上げるために自動処理の技術を応用する仕組みの開発に注力し始めています。Patriciaさんのブログで、プライバシー要素をAI技術で実装する際にどういう手順で進めると良いか類型立てて説明していた内容は役立ちました。

プライバシー保護の観点から、現在のAI技術の問題点についてお聞きしてもよろしいですか?エンジニアの視点でどういう対策が必要なのかもお伺いできると嬉しいです。

Patricia: 話すと長くなりますが。私がブログで紹介した、プライバシー要素をAI技術の現場に導入する前に開発者が確認するといい4つのポイントは、プライバシーを前提にしたシステム設計で参考になると思います。実際には、正確にプライバシーを保護するのは難しく、セキュリティを完璧にするのと同様で不可能に近いです。

私たちがどのように理論的に取り組んでいるかを紹介します。

図:データの流れを前提に考えるシステム設計4ポイント

名称未設定.001

まずは、教師データのプライバシー保護についてです。

AIを導入する際に活用する教師データの中に個人情報が含まれる場合は、データと個人が直接紐づくため個人のプライバシーに十分に配慮する必要があります。たとえば、教師データにテキストデータを用いる際、社会番号が含まれ得る場合はモデリングで記録されないように設計することが考えられます。

次に考えるのがインプットデータです。これはユーザーのプライバシーに関わる問題です。

システムへ送るデータがシステムを通じてアウトプットされるデータと同様にプライバシーを保護できているのかがポイントになります。

最後はデータモデルとプライバシーです。これは企業にとって重要なステップで、セキュリティ上対策が必要なポイントでもあります。アウトプットを前提にして、どれだけのデータをモデル化を通じて集めているのかが対策をする必要があります。

たとえば、アウトプットデータをリバースエンジニアリング技術を活用して解読できるようなケースですね。デバイスに保存されたデータが暗号化されていないケースも考えられます。

Kohei: なるほど、とても興味深いです。どうやって4つのポイントの定義に絞っていったのですか?多くの人は、プロダクトの中でAIがどうデータを処理しているか理解できていないと思いまして。

図 目的となるデータに合わせて技術を選定技術

名称未設定.001

Patricia: 良い質問ですね。ポイントを整理するにはプライバシー技術を理解する必要があり、個別の技術だけでは要素として足りないのが現状です。準同型暗号と差分プライバシー、差分プライバシーと匿名化技術、マルチパーティ計算などがあげられると思います。こういった技術要素は他の技術よりも優れていますね。

プライバシー技術全体を考えることは間違いです。まずは問題から始めて、どの技術が問題に適切に対処できるかを考えます。差分プライバシーは教師データのプライバシー対策としては匿名化の技術よりも優れています。

差分プライバシーはアウトプットのプライバシーを保護する上では準同型暗号と比較すると効果的な手法ですね。準同型暗号では教師データを特定する攻撃から守る際に効果を発揮します。この要素はモデルデータのプライバシーを保護する際に最適で、インプット、アウトプットでのプライバシー保護にも活用できると思います。

Kohei: なるほど、わかりやすいですね。技術を要素に分解して処理プロセスに当てはめるのは、技術を組み合わせる際にとても重要なのですね。ではそのまま次のトピックに移ります。プライバシー技術のこれからについてです。Patriciaさんはこれまで様々なプライバシー技術の開発に携ってきていますが、実社会で利用できるかどうかは事業者視点での関心ごとだと思います。

デバイスへの実利用を目指すプライバシー技術

Kohei: たとえば、Googleは差分プライバシー技術の広告利用を進めていますし、研究者の間では国勢調査で実験的に取り入れています。 こういった技術要素はどこか特定の産業から広がっていくのでしょうか?それとも、技術的にまだ解決が必要な問題が山積みなのでしょうか?

Patricia: よい質問ですね。技術的な課題を解決して実利用を目指していく話でいうと、IoT分野ではサイバーセキュリティデザインが話題になっています。欧州ではセキュリティバイデザインと呼ばれる、システムデザイン設計が求められるようになっています。セキュリティをシステムデザイン設計に組み込んでいく動きは広がると予測していますが、十分なセキュリティ対策をした上で、プライバシー保護も同時に対策していく必要があります。

そこで、私たちはデバイスのプライバシー課題に取り組んでいます。

プライバシー課題に取り組むにあたって研究しているのは、先ほど紹介した技術要素も絡む分野です。準同型暗号を前提としたアルゴリズムの設計や差分プライバシー下でプライバシーノイズを含んだ状態で正確にデータ処理ができるアルゴリズムの開発に関する動きですね。

研究段階なので、実証実験を繰り返して実利用につなげていけると良いと思います。研究から実利用を目的として考えると匿名化や差分プライベート最急降下法などの手法を活用する分野が進んでいます。Googleが提供するGboard上で何をタイピングしているのかを予測する場合に差分プライベート最急降下法などの技術が初期に実装されると思います。

その後、差分プライバシーを活用して企業間での複数サービス部門を横断した活用を進めていくことがケースとして考えられます。現時点ではこういった数少ないケースの実証が進んでいる段階で、他にも技術的な検証が必要な部分は残っています。

Kohei: そうなんですね。話を聞くだけでも、挑戦的な取り組みであることがわかります。利用者視点で日々の生活にどのような便利なインパクトが将来あるかを理解するのは難しい領域だと思います。ビジネス上プライバシー保護をしていく上でどこまで踏み込んで投資するかは課題になりそうですね。

ユーザーとのコミュニケーションもデータを取得する際には不可欠になると思うので、民間企業だけでなく公共機関でも技術的な解決策を模索していく必要がありそうです。Patriciaさんが取り組んでいる事業はとても意義がありますね。

データビジネスに参入する企業へ送る、プライバシー技術導入の手始め

Kohei: それ以外にもブログで気になったのが、プライバシー技術の導入可否を検討するためのツリー状の質問項目です。これはプライバシー技術に初心者の人にとっても、実装していく際の手助けになるのでしょうか?

Patricia: 良い質問ですね。(ツリー状の質問項目は)プライバシー技術の導入を検討しているけれど、どの分野で導入すれば良いかわからない人にお勧めしたいですね。

画像4

(画像:Privacy Enhancing Technologies Decision Tree

問題から考えることが必要なので、ツリー状の質問で問題を整理してから、問題解決のために技術の導入検討を進めるのが良いと思います。私自身がそうして理解を深めたこともあり、理論から具体化していく際に活用できると思います。

プライバイー技術の導入を検討している人たちが実際に活用してくれると嬉しいです。プライバシー問題はビジネス課題として多くの産業でこれから問題になっていくと思います。技術を活用して適切に課題に対応できれば、技術を組み合わせたビジネス連携を進めていく際にも効果的だと思います。

Kohei: たとえば、技術系以外の企業が利用する場合はどのように進めていけば良いでしょうか?GoogleやFacebookなどビッグデータを取り扱う企業はわかりやすいですが、AIや機械学習は技術系以外の企業も導入を進めています。新たにデータビジネスに参入する企業がプロダクト開発を進める際にまず始めるよいことはありますか?参考になるメソッドなどあれば教えて頂けると嬉しいです。

Patricia: そうですね。技術系以外の企業ですね…そうですね。まずはアプリを開発する場合にどんな要素を組み込むべきなのか理解することではないでしょうか。そのためには専門的な知識を持った人を雇う必要があるので、まずはそこから始めていくべきですね。

Kohei: なるほど。

Patricia: もしくは、スタートアップなど専門性を持つ外部の企業に頼んで実装できる領域を徐々に具体化していく方法も考えられます。やるべきは異なる特徴を持つAI技術(自然言語処理など)が果たして本当に機能するかを理解することです。AIにより大量のデータを読ませるのではなく、私たちが抱えている課題をAIで解決することが実現したいことです。ライバル同士で競い合うことを前提に事業を拡大し、ユーザー数を大量に確保することが目的ではありません。まずは、何を解決したいのかを十分に考えてから取り組む必要があります

自社サービス内にどのような形でアルゴリズムを組み込み、拡大していくのか検討する必要があります。

・現時点で何を理解していて、その中にどのようにAIを組み込むのか
・問題が発生した際に、事前に検討したツールがどのように課題に適応するのか

そして、機械学習の知見がある人たちと深く理解し、検討中のアイデアが果たして実現できるかを外部企業と検討する必要があると思います。

技術的な背景を理解していないとサービス内にアルゴリズムを組み込んだ設計ができないので、理解がある人たちと取り組む必要がありますね。 機械学習を実装するのはとても難しく、適切なデータを準備する必要があります。社会で顕在化している課題を前提としてデータモデルを考えて処理する必要があります。適切なデータモデルなしで課題を解決するのはとても難しいでしょう。

Kohei: なるほど、素晴らしいアドバイスをありがとうございます。データビジネスにこれから参入する方々にとって、そうした知見が役に立つでしょう。ただ、すぐに十分な理解に至ることは難しいため、今後も障壁になるのでしょう。技術は解決策の一つです。技術を導入する企業が適切に技術を理解することは市場を育てるためには必要になっていきますね。

技術で課題を解決するには、領域横断した対話が重要

Kohei: では最後に、視聴者の方に向けてメッセージを頂けますでしょうか。技術系以外の人たちも多く見ていると思います。特に、政府や政策立案を進めている人たちにもとても役に立つお話だと思います。

Patricia: はい、そうですね。技術を専門としない人たちからの関心が増えてくるといいなと思っています。様々な専門性を持つ人たちと対話すると新たに見えるものがあります。法律家や政策を進める人たちとの対話もより重要になっていくでしょう。

なにが実現できるのかを学びながら、法律や企業運営にどういった解決策を提供できるか考えていきたいですね。もし関心があれば、気軽にご連絡頂けると嬉しいです。個人的な質問でも大歓迎です。(サイトはこちらhttps://private-ai.ca/

Kohei: 今日はお越し頂きありがとうございました、Patriciaさん。色々と踏み込んでお話できて楽しかったです。技術的の導入が進み、社会のニーズと繋がっていくと嬉しいですね。

Patricia: こちらこそありがとうございました。

データプライバシーに関するトレンドや今後の動きが気になる方は、Facebookで気軽にメッセージ頂ければお答えさせて頂きます!
プライバシーについて語るコミュニティを運営しています。
ご興味ある方はぜひご参加ください。

Interviewer, Translator 栗原宏平
Editor 今村桃子
Headline Image template author 山下夏姫

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
よろしければシェアもお願いします!
8
Privacy by Designとは、技術的・組織的な側面から議論される、人間中心のデータ循環をデザインするための概念です。Privacy by Design Labは様々な専門家がプライバシーに取り組むための社会的機能をリリースしていきます。