見出し画像

インパクト評価雑学:因果推論の大家たち

インパクト投資、成果連動型民間委託、社会的インパクトマネジメントでは、事業とアウトカムの因果関係を示すことが重要です。ある施策とその効果に関する因果関係を明らかにすることを因果推論と呼びますが、その手法として、ランダム化比較試験、準実験デザインの各種手法、機械学習を用いた因果推論などがあります。こうした理論や技術はどのような人たちが形作ってきたのでしょうか。

今回はインパクト評価雑学として、今の因果推論を形作り発展させてきた現代の大家たちをご紹介します。Donald Campbell(1916-1996)、Donald Rubin(1943-)、Judea Pearl(1936-)の3人です。

■異なる学問領域の3人

Campbellは心理学の大家です。インパクト評価でも頻繁に議論になる概念はCampbellによるものが多いです。例えば、実験的な刺激による有意な差が特定の状況で起きたか推論するInternal Validity(内的妥当性)、母集団や状況、変数等に関して一般化可能性を推論するExternal Validity(外的妥当性)はご存知な方も多いかと思います。また、準実験デザインもCampbellによりもたらされたものでしょう。彼はインパクト評価でも利用されることのある不連続回帰デザインも考案しました。これだけでもCampbellの功績の大きさがわかると思います。実際、心理学や教育学における因果性について最も論文で引用されている心理学者の一人と言われています。

Rubinも心理学の学士号をプリンストン大学から取得していますが、その後ハーバード大学で統計学の博士号を取得しました。Rubinの理論は統計学や経済学にて多く利用されています。Rubinは特に統計学において多大な功績を残しており、欠損データに対応するための多重代入法や、ランダム化比較試験ができなかった場合にそれに近い状況を作り出そうとすることを可能にする傾向スコアなどを考案しました。彼は世界で最も引用されている統計学者トップ10の一人と言われています。

Pearlの専門は電子工学やコンピューターサイエンスです。Pearlは人工知能領域に確率論的アプローチをもたらしことや、ベイジアンネットワークを発展させたことで有名です。ACMチューリング賞を受賞するなど人工知能分野に多大な貢献をしています。彼の構造因果モデルや因果ダイアグラム(後述)を用いた因果推論のあり方は、因果推論に機械学習や深層学習の扉を開きました。例えば彼の理論に基づき、Targeted Maximum Likelihood EstimatorとSupearLearnerによる機械学習因果推論が実装されています。(Data-Adaptive Approachという表現をしますが、実際には機械学習と同じことをします。)Pearlの業績は認知科学や人工知能、機械学習に多大な影響を与えています。(私もPearlの理論に沿った因果推論を大学院で学んでいました。)

■3人の共通点・相違点

心理学、統計学、コンピューターサイエンスと学問出自の違いはあれど、3人には共通点があります。程度の差はあれ、実験的手法や専門知を観察研究の領域にもたらしたこと、因果関係における操作可能な原因の重要性を示したことです。(ちなみにランダム化比較試験は1948年にイギリスの疫学者Sir Austin Bradford Hillを中心に肺結核薬の効果を検証するために実施されました。この実験は20世紀で最も偉大な統計学者と言っても過言ではないSir Ronald Aylmer Fisherの理論に準拠したものでした。ランダム化比較試験の原点は疫学で3人の大家と違う学問領域からの出発になります。)

もちろん違いもあります。CampbellとRubinは「AがBを引き起こすかどうか」というシンプルな記述的推論に焦点を当てています。その中でもCampbellはAにあたる原因の構成概念的な妥当性を重視します。つまり、原因が原因たる所以の理論的妥当性を見出していくことも必要としています。一方、Rubinはそれよりも因果効果の推定に焦点を絞っています。Pearlは「AがBを引き起こすかどうか」というシンプルな推論以上に、因果間の影響を仲介するメカニズムに焦点をあてます。因果ダイアグラムという原因・結果・それらに影響を与える他の要素をグラフで記述するのです。これによるモデル構築は因果推論における機械学習の実装を可能あるいはより容易にしました。

また、RubinとCampbellは可能な際はランダム化試験を強く好みますが、Pearlにおいてはその好みは顕著ではありません。RubinもCampbellも実験デザインを重視しますが、RubinはCampbellよりも分析を重視していると言われています。ただ、両者ともに「良い実験デザイン」とは何かという点はよく議論になります。一方でPearlは実験デザインを重視しません。むしろ因果ダイアグラムによる原因結果と共変量の関係性の記述とその概念的作業(バックドア基準、do(x)オペレーターなど因果関係を推論するために行う因果ダイアグラム上での作業です。詳細はPearlの著書をご覧ください)を重視します。しかし、因果ダイアグラムをどこまで正確に記述できるかは議論になりますし、この点についてCampbellもRubinも懐疑的です。

■結び

画像1

ここまで簡単に現在の因果推論を形作った3人の大家とそれぞれの考え方の違いの一部を紹介しました。インパクト評価で利用しているツールが異なる学問領域から集合している学際的な様相は非常に面白いです。

おそらくですが、RubinとCampbellの因果推論の方が、イメージがつき親しみを持ちやすかったのではないでしょうか。この二人の考え方や発案した手法は実際によく利用されます。しかし、Pearlの手法は徐々にインパクト評価にも取り入れられるようになりつつあります。今後数年で、Pearlの考え方をベースにしたインパクト評価も普及していくかもしれません。(私もその一人になるつもりではいます笑)

本稿で触れた以外にも3人の共通点や違いがありますが、それに触れるためには、それぞれの理論の概要を理解する必要があるので割愛します。また折を見て、お一人ずつ紹介できればと思いますが、気になる方はぜひ調べてみてください。

■参考

Shadish, W. R., & Sullivan, K. J. (2012). Theories of causation in psychological science. In H. Cooper, P. M. Camic, D. L. Long, A. T. Panter, D. Rindskopf, & K. J. Sher (Eds.), APA handbooks in psychology®. APA handbook of research methods in psychology, Vol. 1. Foundations, planning, measures, and psychometrics (p. 23–52). American Psychological Association. https://doi.org/10.1037/13619-003

津谷喜一郎, (2011)「日本のEBMの動きからのレッスンー前車の轍を踏まないためにー」『国立教育政策研究所紀要 第140集』45-54.

(文 鈴井豪)


この記事が気に入ったらサポートをしてみませんか?