見出し画像

社会は多様だが、統計調査にマイノリティが存在しない理由

正確な統計データをもとに政策決定を行う重要性が高まっています。統計にテクノロジーを活用することで、これまで見えてこなかった社会の実態が可視化できるようになります。

インタビュー後半は、国勢調査における統計の課題と現在取り組んでいる解決策の話を聞いていきたいと思います。

画像1

プライバシーに配慮しない統計解析は、正しさに辿り着かない

Kohei: ここからは次のトピックに移りたいと思います。

(前編の)冒頭に伺った、Claireさんの子どもの頃の(マイノリティの)経験が気になっています。前のトピックにあったように、国勢調査の正確性はとても重要だと思いますが、プライバシーが保護されない環境では、正確な回答を得るのは難しそうです。国勢調査でプライバシーを保護できていない環境下で考えられる、最大の問題はなにが考えられますか?

Claire: とても良い質問ですね。私が寄稿した記事で、その問題を指摘しています。プライバシーは大した問題ではなく、既に対応済であるから、それよりもデータ活用を進めるべきという論調が多いですが、実はまだ解決されていません。

この問題について、周りの人たちとよく話しています。国勢調査でより多くの情報を知るためには、プライバシー保護が約束されないという課題が残っています。2010年以降の10年間で多くの活動や情報がデータ化されたものの、プライバシー保護と統計データの活用のバランスに関しては、米国に住む3億3000万の人たち全員に関わる問題として根深く残っています。

プライバシー保護の問題を解決せずに調査を進めると、調査に必要なデータを十分に集めるのが困難になります。田舎の地域は住民数が限られるので、調査データの集計から外れることは少ないと思います。私の知り合いで英国や日本から移り住んでいる人も、地域ではとてもユニークな存在なので、統計から外れることは稀なケースだと思います。

図 地域によって住民の属性が大きく異なる(数値は比較のために仮に置いた数字で正確にデモグラフィックを表すものではありません)

名称未設定2.001

私が住んだことのあるワシントンD.C.のコロンビア地区の話をします。

コロンビア特別区は、米国の首都のなかでも多様な人たちが居住しています。国籍や背景の異なる人たちが年齢関係なく住み、私のように少数派のアジア系アメリカ人が仮に統計データに含まれなくても、少数派の人たちは気づくことがないと思います。

一方で、私が育ったのは米国の田舎(アイダホ州:Salmon)にあたる地域です。

主に白人が居住し、居住者の多様性があまりないので、地域内で目立つ存在の私が統計に含まれないように設計することはとても難しいと思います。個人の権利を侵害していないか技術的に検討して調査を進めることで、情報の正確性とプライバシーが実はトレードオフの関係性にあるとわかると思います。

田舎の地域で正確に情報を取得しようと思うと、その情報はすぐに地域内に伝搬します。そのため、どこまで公開できるかを倫理的に考えることが必要です。

それ以外に、白人が大多数を占める居住区では、少数派の人たちは全体の統計から容易に削除される可能性があります。

少数派の人たちを考慮せず、意図的に、営利目的を優先した統計を進めると正確な情報に辿り着けなくなります。ことさら不況では、特定の層に関する調査をする必要性が高まりますが、対象者を絞らずに調査プログラムを実施すると、マイノリティが統計データに反映されない事態が起きます。

図 統計データに反映されなければ公的支援が行き届かない

名称未設定2.001

今のように経済が停滞している状況では、誰が少数派に属しているか、健康上の理由で支援が必要な状況にあるかを前提に考える必要があります。

米国中西部はまさにそういう地域ですね。

中西部は、食肉処理工場でヒスパニック系の人々が多く働いています。実際に中西部地域で働く人たちは、コロナが発生した初期から生活に大きな影響を受けました。

中西部で(政策立案のための)統計調査をするには、影響を受けたヒスパニック系の人々に対象を絞り、彼らが統計データに反映されるように調査する必要があるのです。

Kohei: なるほど。各州で人口分布は異なりますが、プライバシー問題によって政策決定に影響を与えたケースは実際にあるのでしょうか?統計上の問題が政策決定に与える影響になにが考えられますか?たとえば少数派の人々が統計対象から外れることで、公共サービスを受ける資格が取り消されるなど。教えて頂けると嬉しいです。

Claire: 統計調査の問題でそうしたケースは発生していると思います。

特定のケースを紹介することは難しいですが、大多数の人々が調査に協力して情報提供する一方で、プライバシー情報の公開を控える人も増えています。2018年にFacebookがケンブリッジアナリティカに情報提供していた問題は、私たちの行動に大きく影響しています。2019年から2020年初めに携帯電話の内容をトラッキングされていたケースも、さらなる不審を広めています。

加えて、国政調査が厳しく実施されることに不安を覚える人も増えている印象です。2020年に入ってコロナの接触感染を追跡されるようになり、緊張感が増しています。接触感染におけるプライバシーの問題もとてもセンシティブですね。

医療記録に対し、プライバシーを懸念する声もあがっています。個人がこれまでに患った疾患、たとえばHIVや癌などが記録されます。こうした医療記録がコロナ感染と紐づけて(第三者機関に)記録・調査されるなど当初の目的と異なって使用される可能性への懸念があるからです。

Kohei: そうですね、コロナ禍ではプライバシーに対する懸念が各国で起きていると思います。

"公正な国勢調査"はどう実現できるのか

Kohei: これまでのお話を踏まえ、記事にも紹介されていた公正な(Equity)国勢調査についてさらにお伺いします。立案した政策を現場で進めるために国勢調査の統計は重要だと思いますが、どうすれば”公正な国勢調査”を実施できるのでしょうか?

Claire: 公正な国勢調査ですね。とても良い質問だと思います。

(私は)他の専門家よりも国勢調査のデータに関わる機会は多くなく、(関わった際にも)主にプライバシーの活動をしていたので、技術の話は少し控えたいと思います。

公正な国勢調査には、透明性が求められると思います。 旧来の手法ではプライバシーに配慮した設計がなされず、調査対象者が情報を公開するのは難しい環境でした。特にリバースエンジニアリングと呼ばれる手法で(調査結果から)遡って個人の情報を解析されるのが不安だったようです。

そうした背景もあり、新しい手法や技術には透明性を十分に担保してほしいです。その上で、個人の情報をバックトラッキングやリバースエンジニアリングで解析されないと説明することが(国勢調査に)期待されます。

公正な国勢調査について別の視点で話すと、私の専門ではありませんが、政治的な意図を排除することも必要になると思います。現在の政府は、不完全に収集したデータを基に判断しており、コロナ対策にも遅れが出ました。政治的な圧力で必要なデータが削除されることも避けなければなりません。公正な国勢調査を実現するには、国勢調査を中断せず、米国全土で時間をかけてでも最後まで統計データを収集する必要があります。

そのため、市民が安心して回答できる環境整備も必要です。統計漏れがないように、米国に住む全ての人が回答できるような環境は必要ですね。

Kohei: なるほど、透明性やアカウンタビリティの問題は統計にも必要なのですね。

政策立案にプライバシー技術を取り込むための課題と展望

Kohei: 新しいテクノロジーとして、差分プライバシーの活用が進んでいますが、今後どういう技術要素が政策立案の現場で応用されるでしょうか?将来的にどの技術要素が必要になるのか気になっています。

Claire: 個人的には、差分プライバシーは保守的に見つつ、楽観視もしています。私が論文で発表したテーマですからね。

透明性を考える上で、第三者がデータにアクセスして解析または不正利用するのを防ぐ技術的な対策は、プライバシー保護を考える上で重要だと思っています。

これまでの手法には様々な欠陥がありました。誰かが正確な情報を歪めてしまう場面は事前に避ける必要があります。

私が保守的で楽観視している理由の一つに、差分プライバシーが新しい技術であることが挙げられます。

プライバシーの定義自体も新しい分野ですからね。これは(差分プライバシー自体の)技術的な問題でなく、差分プライバシーが機能する環境を技術的に実装できるかが問題です。私たちはこれを差分プライベートや差分プライベート手法と呼んでいます。差分プライバシーの活用方法はまだ見出せていませんが、様々に模索しているところです。

加えて、試験データを活用した実証の取り組みを増やす必要があります。(2010年から2020年の)10年間の国勢調査データは膨大な量で、試験用のデータとして有用です。懸念点があるとすれば、統計分析を実施する前に「国勢調査データが適切に米国全土の情報を反映しているのか」を十分に検討する必要があります。2020年の国勢調査では差分プライバシーを活用していないので(検討する必要があるのです)。

ここから言えるのは、プライバシー対策分野の進展が必要なことと、特にコロナの状況では、公共政策を検討する側は、(調査回答者と)専門家のみならず統計データを集める現場の担当者と現場の実態を理解するためのコミュニケーションをとる必要があるということです。社会全体に目を向けると、プライバシーが技術的に保護されていると全ての人が理解するのは難しいでしょう。そのため政治家は、技術を理解することが求められます。そして技術の開発者は、政治家に対する説明が求められます。

私が記事で紹介した内容から補足すると、これまで以上に(国勢調査の)仕組みが複雑化しているので、政策を検討するためのコミュニケーションの必要性を感じているのです。

Kohei: なるほど、ありがとうございます。とても参考になる内容でした。

統計データから根拠を示す際、ある部分が省略される可能性には十分に言及される必要がありますね。政策によって実現したいことのための根拠がなにかを再考し、社会全体でどういうデータが必要かを考える必要があると思います。

データを、データでなく個人として捉えることがとても重要で、誰かが取り残されることのないよう、包括的な仕組みを検討していきたいですね。

立場の異なる人とのコミュニケーションを起点に、新たな技術を理解していく

Kohei: 最後に、Claireさんのこれまでの経験を踏まえ、メッセージをお願いします。政策や根拠を考える上でとても参考になるお話でした。

Claire: 私からは、改めて教育とコミュニケーションが必要だというメッセージをお伝えしたいです。

米国の学術界でこうした話が強調されることは稀ですが、コミュニケーションを起点に変化することが必要です。

テクノロジーが発展している一方で、10年間(国勢調査の制度と手法が)変化していないことに政策立案者は煩わしさを感じることと思います。今日、私たちは様々な学問を組み合わせて変化を生み出す必要があります。いいプログラムにはいいコミュニケーションが必要です。社会全体で理解を進めなければ学問の功績も無駄になってしまいます。

コミュニケーションを通じて(立場の異なる者同士で)互いに理解し、自分が未来に向けて取り組んでいることを形にして伝えていって欲しいですね。

Kohei: 素晴らしいメッセージをありがとうございます。

教育は今後重要性の増すテーマだと思います。特に、若い世代から学ぶ姿勢が大切ですね。学びの考え方も大きく変化していくのでしょう。

本日はインタビューにお越し頂き、ありがとうございました。

Claire: こちらこそありがとうございました。活動に関してお話しできて良かったです。この取り組みは広げていきたいですね。

Kohei: ありがとうございます。

データプライバシーに関するトレンドや今後の動きが気になる方は、Facebookで気軽にメッセージ頂ければお答えさせて頂きます!
プライバシーについて語るコミュニティを運営しています。
ご興味ある方はぜひご参加ください。

Interviewer, Translator 栗原宏平
Editor 今村桃子
Headline Image template author 山下夏姫


この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
次の記事も楽しみにしていてください!
8
Privacy by Designとは、技術的・組織的な側面から議論される、人間中心のデータ循環をデザインするための概念です。Privacy by Design Labは様々な専門家がプライバシーに取り組むための社会的機能をリリースしていきます。