見出し画像

政治を左右する、米国の国勢調査ディセニアルのプライバシー問題

政策を決めるときに市民の声を集めることはとても重要です。データを用いた政策立案に必要なエビデンスとはいったい何か考えていくことがこれから必要になっていきます。

インタビュー前半は、昨年のアメリカ大統領選の際に話題になったアメリカの国勢調査の裏側とデータを用いた政策の話を聞いていきたいと思います。

画像1

Kohei: Privacy Talkにお越し頂きありがとうございます。今回はClaireさんをお招きしてお話を聞いていきたいと思います。Claireさんはデータ統計と根拠に基づく政策立案の専門家です。

なぜClaire氏と話そうと思ったのか

Kohei: 今日のトピックは米国の国勢調査の話を中心に、彼女の経験からお話を聞きたいと思います。今年(2020年)は大統領選が話題になりました。政治の方向性を決める国勢調査のなにが問題で、公正な政策立案にはどのような社会的根拠が必要かをお伺いできればと思います。

お越し頂きありがとうございます、Claireさん。

まずは彼女の紹介をさせてください。ClaireさんはワシントンD.Cに本部を置く米国シンクタンクのUrban Instituteで、プライバシーとデータセキュリティ関連のプロジェクトを率いるデータサイエンティストです。

彼女は異なるデータ要素を統合し、科学的に解析する手法の研究をしています。2016年にアメリカ合衆国国勢調査局のインターンに参加し、アメリカのコミュニティの収入に関する調査で統計手法の開発に携わりました。

アイダホ州立大学で数学と物理の学士を取得し、ノートルダム大学で統計学の修士を修めています。卒業後はロスアラモス国立研究所に勤め、宇宙線の影響に関するスーパーコンピューターを用いた調査をしました。

Claireさんは、アメリカ国立科学財団の卒業研究フェローシップ、マイクロソフトウーマンフェローシップに選ばれ、統計学で有名なガートルード・メアリー・コックス奨励金を受けました。アメリカ国立科学財団のインターンシッププログラム、財団の基金で設立したコンピューター及びデータサイエンスプログラムにも選ばれています。

今回は、様々かつ深いお話ができることを楽しみにしています。

Claire: お招き頂きありがとうございます。

Kohei: ありがとうございます。では早速インタビューの内容に入っていきたいと思います。Claireさんのこれまでの取り組みを拝見し、とても興味を惹かれました。というのも、私も政策に関わった経験が少しあり、特に統計データを基にした調査結果は政策の方向性に大きな影響を及ぼすことを体感していたためです。

Claire氏の経歴

Kohei: まずClaireさんにお伺いしたいのは、なぜ統計や分析という分野に関心を持ち始めたのでしょうか?ぜひお聞かせください。

Claire: そうですね。私は(最初に)物理を専攻しまして、その理由は小さい頃から科学が好きだったからです。当時から、大きくなったら科学に関わる仕事をしたいと思っていたと思います。ただ、大学に入ってから社会がどう動いているかを理解したいという考え方に変わり、(科学の中でも)とりわけ物理を専攻するようになりました。

実際に物理のプログラムを受講してみると、これはまた関心領域と少し違うなと思い始めました。理論家よりも数学的な分野の方が自分に合うと感じたのはその時期です。

色々な分野を知りたくて、研究プログラムにいくつも応募しました。複数の分野に関わるなかで、特に統計に関心を持ちました。ジョン・テューキーという有名な統計学者の方が残した "The best thing about being a statistician is that you get to play in everyone's backyard." という言葉が記憶に残っています。

化学や数学の研究はとても好きですが、分野が異なるので、私は統計学者として異なる分野が交わる研究に惹かれました。そこで、注力する分野を明確に決めず統計学を専攻することに決め、学ぶうちに自分に合うことが徐々にわかりました。

統計学のアドバイザーから、無作為化(ランダム化)と相性が良いという理由でデータとプライバシーの分野を勧められたのが、データプライバシーを専門にするきっかけでした。そこから様々な論文を読んで関心が湧き、今では本格的に取り組むようになったのです。ありがたいことに研究の資金調達に成功し、データプライバシー分野に注力できるようになりました。

関心があるのは、データを公開する際のプライバシー領域です。統計データの活用と個人のプライバシーのバランスを取り、プライバシーを担保する領域に取り組んでいます。

図 プライバシーを担保しないことで不十分な統計情報になる

名称未設定2.001

実際のところ、データ公開時にプライバシー保護を重視しすぎると、統計的なデータ活用が困難になるという問題があります。保護と利活用は前提に矛盾があるので、どのような解を考えるかが今のテーマです。とても難しい問題ですね。

インタビューのアジェンダから少し逸れたので、アジェンダに戻りましょう。

こうしてデータプライバシーの道を歩むなか、政策分野との違いを理解し始めました。

教授になる道を選び、研究に注力する選択肢もありますが、当時は人に物事を教えるのがあまり好きでなく、大学職という選択は私にはありませんでした。その後、アメリカのロスアラモス国立研究所など複数のインターンプログラムを経験したのは、研究領域を広げたかったからでした。

私の経歴は、普通の人と少し異なりますが、営利を追求しない政策立案の取り組みに相性の良さを感じています。自分の研究領域を通じて、社会に影響を与える機会を提供できればと思います。

Kohei: 素晴らしいですね。

民間企業が発表する統計結果は”Equity”観点が欠けている

Kohei: 統計について少し聞きたいことがあります。GoogleやFacebookなど民間企業でなされる統計と、国や行政など公共団体でなされる統計にどういう違いがあるのでしょうか?

Claire: 公共と民間での違いですね。

私がこれまで活動してきた非営利組織についてお伝えすると、統計を実施する前提に公共の利益が中心に考えられていることが挙げられます。その前提で作られた統計関連の情報はオープンソースで公開され、統計情報を閲覧するためにお金を支払う必要もありません。

一方、民間の統計は、作成した統計結果を民間企業が権利として所有するため全てが公開されるとは限りません。民間の統計結果は内部活用にとどまるか、有料で提供されます。

また、目的が異なることもあります。

私が働いているUrban Instituteでは(公共の利益を前提にして)都市開発や設計をするため、統計結果を参考に用います。様々な方がデータにアクセスできるように、統計を実施する過程で回答者のプライバシーには十分な配慮をします

(反対に、FacebookやGoogleなど営利目的を前提とした企業は、営利目的に沿って限定的な対象者に調査することが多く、プライバシーの暴露を気にして回答しない人の情報を回収するために注力はしていません。)

都市だけでなく連邦政府組織と政策設計をすることもありますが、多くのスタッフがデータにアクセスしていて、有料で公開する仕様には実際なっていませんね。

Kohei: なるほど、理解しました。”統計”と言っても主体が誰かによって(こんなに具体的に)異なるのですね。

コロナの状況で、公共の利益のために民間企業がデータを公開していました。”統計”という同じ言葉でも、調査目的によって言葉の解釈が大きく異なるように感じます。民間企業が”公の利益”を想定するとしても、文脈が異なるという印象を持っているのです。

データを取得する際、データを十分に収集できているかという基準も、目的から考えなければ矛盾が生まれると思いますね。

米国の国勢調査ディセニアルがもつプライバシー問題の動向

Kohei: 次の質問では日本でも報道されていた、米国の大統領選で実施された国勢調査について伺います。Claireさんが記事で紹介していたように、インターネットの広がりによって2010年から2020年までの10年間に私たちの社会環境は大きく変化したと思います。国勢調査にはどのような変化がありましたか?

Claire: 過去10年間に変化したことですね。

今年(2020年)はコロナの流行に加えて大統領選が実施されるという珍しい年でした。2010年から10年経つ今年(2020年)は、ディセニアルと呼ばれる、米国住民に対して10年ごとになされる国勢調査が実施された年でもあります。

ディセニアルでは、米国に住む一人一人に質問に答えてもらいます。 これは重要な調査で、大統領選だけでなく地方選挙の選挙区の改正にも利用されます。日本の報道では少し混乱したかもしれないですが、米国では各州で選定された選挙人団(大統領と副大統領を選出するための人々)を投票で選出し、選挙人団の数で選挙結果が確定します。この制度は大きな意味を持ち、たとえばカリフォルニアが50議席を持つのに対し、私が住むニューメキシコは僅か5議席に留まります。

州人口の国勢調査で決められている下院と上院議員の人数をもとに、それぞれの州に適切な議席数を割り振っていきます。この作業に米国は1.5兆ドル(150兆円以上)を投資し(調査や制度の変更を実施し)ています。とても大きな投資ですね。

2010年の国勢調査と2020年のそれでは、市民のプライバシー意識に大きな変化がありました。

これまでの国勢調査の詳細は、(国勢調査の歴史に関する)動画にインタビューの様子が公開されているので見て頂ければと思いますが、米国の国勢調査では個人のプライバシーを法で保護することが認められています。統計結果を公表する際にも個人のプライバシーを保証する必要があります。

さらに、(国勢調査には)正確性も求めらます。

国勢調査の結果をもとに、選挙人団制度の実施が決まり、予算45兆ドル(約500兆円)が注ぎ込まれるのです。

2010年と2020年の状況を比較すると、大きな違いはテクノロジーの目覚ましい進展です。10年前に想像できないほど、回答者のプライバシーを保護するのが困難になっています。10年前、私たちのポケットに全てのコンピューターが収まると思わなかったでしょう。10年を経て、スマートフォンが当時のコンピューターの平均的な役割を上回ったとも言えます。

コンピューターの力を借りることで、公共のデータを取得するのは容易になりました。これは最大の変化です。国勢調査も、プライバシーを保護するための施策を検討し、たとえば2010年の統計データに対するリコンストラクションアタック(公開情報からプライベートのデータセットを構築する)のようなプライバシー侵害の脅威への対策を実施しています。

ここまで紹介した内容は、2020年の国勢調査を実施する前に大きく変化したポイントです。

Kohei: そういうことがあったのですね。

日本では、国勢調査で担当者が市民の自宅を訪問しますが、コロナやプライバシー情報の公開への懸念から調査拒否されるケースが報告されています。 訪問する調査員は、回答者にとって見知らぬ人であることが多いです。さらにコロナの状況ともなれば接触を避けるのでしょう。感染経路が不明な状況で、個人の情報を公開することに私たちは消極的になっているようです。

インタビューは後編に続きます。

データプライバシーに関するトレンドや今後の動きが気になる方は、Facebookで気軽にメッセージ頂ければお答えさせて頂きます!
プライバシーについて語るコミュニティを運営しています。
ご興味ある方はぜひご参加ください。


Interviewer, Translator 栗原宏平
Editor 今村桃子
Headline Image template author  山下夏姫

この記事が気に入ったらサポートをしてみませんか?