見出し画像

Causal AIとは何か?人工知能による因果推論の可能性【AIと因果推論#1】

お疲れ様です。日経電子版を読むためにiPadを買いましたが結局スマホで見るので使わなくなってしまったShinです。

さて、人工知能や機械学習についてはここ数年話題に上がり続けているテクノロジーのホットトピックのひとつですが、これまで関わる機会が特になく全く知識がありません。とはいえ、IT業界にいる人間が全く知らないのも如何なものかと思い、一般常識レベルから調べてみようかと思っています。

AIと言えば、その特徴に応じて〇〇AIのようにいくつかの種類に分けられていることがあります。特に近年話題のコンテンツ生成を行うAIは Generative AI (生成AI) と呼ばれていますし、それに対して従来型のデータ分類を行うようなAIはDiscriminative AI (識別系AI) などと呼ばれたりします。

本日はこれら〇〇AIのうち、Causal AI について取り上げてみたいと思います。いきなりマイナーなところから入る感覚がしますね。

Causal AIとは何か?

まず Causal AI とは端的に言うと何なのでしょうか。学術的な定義は一旦置いておいて、いったんWikipediaの説明を見てみることにします。ちなみにGoogleで検索してみても、Generative AI ほど大きな注目を浴びていないからか、日本語の記事はあまり見受けられませんでした。

Causal AI is an artificial intelligence system that can explain cause and effect. Causal AI technology is used by organisations to help explain decision making and the causes for a decision.

Wikipedia

Wikipediaの記述によれば Causal AI とは、因果と効果を説明できる人工知能システム、とのことです。さらに参考文献として掲載されている論文を読んでみます。Segaier et al. (2020) の論文 "The Case for Causal AI" には、Causal AIについての説明として以下の記述がありました。

Causal AI indentifies the underlying web of causes of a behavior or event and furnishes critical insights that predictive models fail to provide.

Sgaier, Sema K; Huang, Vincent; Grace, Charles (2020).
"The Case for Causal AI". Stanford Social Innovation Review. 18 (3): 50–55.

日本語に訳すと、ここでは「Causal AI は行動や出来事の原因の根底にある網を特定し、予測モデルでは提供できない重要な洞察を提供する」と記述されています。

この記述に見られる通り、Causal AI は従来の Predictive AI (予測AI) と比較して生まれた概念と見ることができそうです。

ここからは、Segaier et al. (2020) の内容をもとにより Causal AI について深掘りしていきたいと思います。

Predictive AI の限界:相関と因果の識別

それでは、従来型の Predictive AI の限界とは何だったのでしょうか。端的な結論としては、相関関係と因果関係の識別可能性です。相関関係と因果関係の違いは統計学においても基礎中の基礎として扱われる概念ですね。

よくある例としては、「アイスクリームの売上」と「ビールの売上」の関係が挙げられます。両者には正の相関(二変数が存在するとき一方の変数量が増加する場合にもう一方の変数量も増加する傾向)があると言えます。したがって両者には相関関係があると言えますが、これは因果関係、つまり一方の変数の変化が原因でもう一方の変数に影響を与える関係、であるとは言えません。アイスクリームの売上が増えたからと言って、ビールの売上が増えるとは限らないのは想像に易いかと思います。

この例では、実際には「アイスクリームの売上」と「ビールの売上」のほかに「気温」という変数があり、「気温」と「アイスクリームの売上」に因果関係が、「気温」と「ビールの売上」に因果関係があると考えられます。アイスクリームもビールも、気温が高くなればより購買されると考えられるため、正の相関関係が見られるというこうとになります。

さて話を戻すと、Predictive AI の洞察アルゴリズムはこの関係を誤認する可能性があります。投入されたデータに基づき、事象Xが観測された場合に事象Yが観測されると、それを相関関係か因果関係かを識別せずに Insight として出力する恐れがあります。特に医療や農業、司法においてAIを適用する場合には、相関関係を因果関係と誤認すること(=疑似相関の問題)は致命的な問題です。

No matter how sophisticated, predictive algorithms and their users can fall into the trap of equating correlation with causation—in other words, of thinking that because event X precedes event Y, X must be the cause of Y.

Sgaier, Sema K; Huang, Vincent; Grace, Charles (2020). "The Case for Causal AI". Stanford Social Innovation Review. 18 (3): 50–55.

それを解決する一連の試みが Causal AI です。

Causal AI による因果推論の適用例

相関関係でなく因果関係に注目する統計学的アプローチは「統計学的因果推論 (causal inference in statistics)」と呼ばれます。因果推論の意味は、以下のNRIの用語解説をそのまま引用します。

入力データ(インプット)と出力データ(アウトプット)から、その因果関係(原因とそれによって生じる結果との関係)を統計的に推定していく考え方のこと。

野村総合研究所 用語解説|技術|因果推論
https://www.nri.com/jp/knowledge/glossary/lst/aa/causal_inference

従来の Predictive AI の課題に対応するため、因果推論が可能なAIを作り出そうとした試みが Causal AI ということですが、実際に Causal AI でどのようなことができるようになったのでしょうか。Segaier et al. (2020) に掲載されている事例を引用して紹介します。

①パキスタンにおける子供の下痢の要因

特に発展途上地域で顕著な健康問題のひとつとして幼児の下痢が挙げられます。この要因についてパキスタンの家計調査データを元に分析を行ったところ、従来の統計学的分析手法である多変量解析では12の変数が関連していることが分かりましたが、これらの変数は解釈が難しいものが多く実用的な結果ではありませんでした。ここで Causal AI 的アプローチにより、因果関係として考えられる要因事象として、乾式便所の使用、水源の依存、ゴミ収集の欠如、の三つが有効な要因であることを突き止めました。

②インドにおける出産時の医療施設利用の要因

発展途上地域では出産時における母親と新生児の死亡率が高い傾向にあり、インドでは医療機関での出産を奨励することで死亡率の低下を図っていました。ここで医療施設の利用を促進するためには何が要因となり得るかを推定し、医療施設の利用に相関する変数を複数発見しました。さらにCausal AI 的アプローチにより直接的な因果関係を持つ変数の特定を試みたところ、医療機関への物理的距離よりも交通アクセスが、病院の清潔感よりも自宅出産よりも施設出産の方がより安全であるという信念が、より重要な要因であるという結果を導きました。

以上のように、Causal AI を用いた因果推論により、事象の潜在的要因を突き止め、根本的な原因を解決する政策アプローチを可能にします。今回紹介した事例はいずれも発展途上地域における経済開発のための政策アプローチに繋がるものでしたが、先進国の企業活動にも十分適用可能な内容であると言えるでしょう。

おわりに

今回は Causal AI の概要についてご紹介しました。次回は具体的に Causal AI がどのようなメカニズムで因果推論を実現しているのか、引き続き Segaier et al. (2020) の論文を読み進めながら触れていきたいと思います。


この記事が気に入ったらサポートをしてみませんか?