見出し画像

経セミ連載:成田悠輔・矢田紘平「データで社会をデザインする:機械学習・因果推論・経済学の融合」

■はじめに 

経セミ連載=成田悠輔矢田紘平データで社会をデザインする:機械学習・因果推論・経済学の融合」が、 2021年6・7月号 よりスタートしました。 

 第1回のタイトルは「すべてがデータに、アルゴリズムに、そして実験になる」 でした。

そして、2021年8・9月号掲載の第2回タイトルは「過去を反省する」です!

各回のタイトルからしてちょっと変わったこの連載。はたしてどんな内容なのか。

このnoteでは、本連載のコンセプトと今後のプラン(ただし変更の可能性アリ)についてご紹介します! 

■どんな連載?

どんな内容なのか? それは、連載第1回でかなりじっくり解説されているのでぜひご覧ください。

では全然紹介にならないので、連載の目的を簡単に整理します(ここに至るお話が面白いので、ぜひ本編もご覧ください!)。

この連載でまず触れる重要ポイントは、第1回のタイトルになっているとおり、遠くない将来、「すべてがデータになる。すべてがアルゴリズムになる。そして、すべてが実験になる」社会が訪れる、ということです。そして、そんな未来をサバイブしていくために必要な技術を提供しよう、というのが本連載の目的です。

なお、著者の一人の成田悠輔先生もTwitterでこのように紹介されています!

成田先生のTwitterコメントにあるように、この連載は「使えるものはなんでも使うデータ科学の総合格闘技」をうたい、経済学、機械学習などの特定分野にとらわれることなく、役立つ情報を実例とともにじっくり解説していきます。機械学習と因果推論の両方の基礎を身につけ、両者を融合して、データで社会をデザインする統一アプローチを学ぶことができる内容を目指しています。機械学習と因果推論の両方の基礎を身につけ、両者を融合して、データで社会をデザインするための統一アプローチを学ぶことができる内容を目指しています。

前提知識となるのは、高校理系数学か大学文系教養数学程度の確率・統計・解析で、連載内でもこのレベルの数学が用いられる予定です(「線形代数はたぶんほとんど使わない」)。

それ以外の予備知識は求めず、自己完結的に理解できる解説を目指します。端的に、「学部レベルの経済学で使う数学をかじったことがあれば十分だ」とのことです。

また、第2回「過去を反省する」でも、以下のようなコメントがあります(『経済セミナー』2021年8・9月号、110ページ)

実際、因果推論・計量経済学・機械学習の核心的結果は高校~大学教養程度の確率・統計の知識で十分に消化できる。この連載ではいたずらに数学的洗練を追うことはせず、最低限の武器で最大限の獲物を目指すコスパ重視の姿勢を貫こうと考えている。

■連載のプラン

それでは、本連載はどのようなプランで進んでいくのでしょうか? 第1回の執筆時点で予定されている内容を、以下でご紹介します。ただし、ここで示している構成や項目は確定しているわけではありません。成田・矢田先生からは、「もし扱ってほしいテーマや質問・感想などがあれば、以下のメールアドレスまで気軽に送ってほしい」との言葉を預かっています(ご返信ができない場合もございますが、すべてに目を通し、連載の内容に随時反映すべく検討いたします)。

keisemi.data.science@gmail.com

【Part 1】過去を反省する:因果推論

為すべきか、為さざるべきか? それが問題だ
 ◆為さざる世界を記述する相関、為した世界と為さざる世界の違いを記述する因果
 ◆人間にとって因果関係とは何か
 ◆幻想としての因果関係
人工実験(治験、A/Bテスト、ランダム化実験)
 ◆応用事例:コロナワクチン開発・治験
人工実験への倫理的懸念
 ◆応用事例:続コロナワクチン開発・治験
 ◆応用事例:炎上したFacebookの感情操作実験とAmazonの価格操作実験自然実験
 ◆技法:野生のランダム性、200万個の回帰モデル、傾向スコア
   ・応用事例:社会起業家は公教育を救えるか?
 ◆技法:忘れられた断がい絶壁(回帰不連続デザイン)
   ・応用事例:電子投票が貧困家庭を救う?
   ・応用事例:エリート進学校は実は無意味?

【Part 2】未来を予測する:機械学習
どんなに丁寧に過去の因果を検証しても、それが未来を正確に予測するとは限らない。世界は常に過去を水に流して変化していくからだ。

因果 vs. 相関ふたたび:擬似相関の価値
 ◆応用事例:ニコラス・ケイジが映画に出るとプールで人が溺れる?
 ◆応用事例:Google Flu Trendとコロナ予測
教師付き学習
 ◆安定した世界を予測する
   ・応用事例:衛星データは宝の山──原油から駐車場、アフリカまで
   ・応用事例:金食い虫の末期患者をみつけ出す
 ◆激変する世界を予測する
   ・応用事例:コロナ感染者数・死者数予測

【Part 3】未来を創造する:因果推論×機械学習×経済学の融合
これまで見てきた因果推論と機械学習は世界をさまざまに解釈してきたにすぎない。重要なことは世界を変えることである。世界を変えるのは意思決定であり資源配分である。

技法:データを食べて意思決定するアルゴリズム
 ◆強化学習・バンディット
   ・応用事例:ZOZOTOWNのファッション陳列
   ・応用事例:テック事業としてのAbemaTV
技法:自然実験としてのアルゴリズム
 ◆続強化学習・バンディット
   ・応用事例:続ZOZOTOWNのファッション陳列
   ・応用事例:続テック事業としてのAbema TV
 ◆データ駆動型制度設計
   ・マッチング・割当アルゴリズム
    [ 応用事例]Googleの社内人事アルゴリズム
   ・オークション
    [応用事例]あなたの移動を追跡する広告機械
 ◆デジタル公共政策
   ・応用事例:中国政府がチベット・ウィグル自治区で展開するデータホロコースト?
   ・応用事例:Apple Health
   ・想像事例:映画「イーグル・アイ」

【Part 4】データ×社会の未来

漫才コンビとしてのデータと人間
  ◆技法:逆強化学習と構造推定
    ・応用事例:CM放映スケジューリング
  ◆技法:データ融合・平均五感のデジタルデータ化へ
  ◆視覚・聴覚の征服
  ◆味覚・嗅覚・触覚という新大陸
心と精神のデジタルデータ化へ

そして、連載の第2回は「過去を反省するです。ものごとの「因果関係」をどう捉えるか。その基本的な考え方と、人工的に実施する「実験」について、たくさんの具体例を交えて解説しています。

画像1

第2回は、以下のように始まります。連載はまだまだスタートしたばかり。ぜひ『経済セミナー』本誌をご覧ください!

 データは1人ではいられない。答えたい問いと結びつき、分析されてこそ真価を発揮するのがデータだ。問いに答えることが料理だとすれば、データは材料で分析は調理だと言えるかもしれない。
 作りたい料理によって調理法がさまざまなように、データの解析にもいくつかの類型がある。わかりやすい分析の1つは、過去の行為や施策の効果を検証することだろう。過去に起きてしまったことは変えられない。だが、やってしまった行為が正しかったのか間違っていたのかわかれば、同じ間違いを起こすことは避けられるし、正解を反復して拡張していける。未来は変えられる。そのために、過去の行為がどんな影響を持ったのか、一見影響に見える相関は本当にその行為の影響なのか、因果関係のレベルで確かめることが必要になる。

発売中の最新号へのリンクは、こちらから!

■著者紹介

最後に著者紹介を。

成田 悠輔(なりた・ゆうすけ)
昼は半熟仮想株式会社代表取締役、夜はイェール大学助教授。
「意思決定・資源配分アルゴリズムをデータ駆動にデザインする手法」の開発と、機械学習ビジネスから教育政策まで幅広い社会課題への応用が専門。多分野の学術誌・学会に研究を発表、サイバーエージェント、ZOZO、学研などと共同研究・事業を行う。内閣総理大臣賞、MITテクノロジーレビューInnovators under 35など受賞。文學界、Forbes、共同通信、Yahoo!ニュースのコラムニスト、テレビ朝日・報道ステーションのコメンテーターも務める。

矢田 紘平(やた・こうへい)
イェール大学経済学部博士課程。
東京大学大学院経済学研究科修士課程修了。2016年よりイェール大学経済学部博士課程に進学。専門は計量経済学、特にデータ駆動型意思決定手法
の理論と応用。主著: "Algorithm is Experiment: Machine Learning, Market Design, and Policy Eligibility Rules,"(成田悠輔と共著)Working Paper, 2021.



サポートに限らず、どんなリアクションでも大変ありがたく思います。リクエスト等々もぜひお送りいただけたら幸いです。本誌とあわあせて、今後もコンテンツ充実に努めて参りますので、どうぞよろしくお願い申し上げます。