見出し画像

AICの使い方を考える

どうも、スミスです。

先日、統計数理研究所の公開講座である「LeadingDAT養成コース(ハーフコース)」を修了しました。

年末年始はその課題レポートに取り組んでいたのですが、「AICってなんだ?」となり、いまいちうまく活用できている気がしませんでした。
なので今回は、データ分析において、AICをどのように使って考察してあげるのが誠実かを考えていきたいと思います

AICの正体とは

まず、AICの正体を掴むために、AICを表す以下の式を分解します。

スクリーンショット 2021-02-07 17.42.03

上式を構成するのは、「最大対数尤度」と「バイアス」になります。
最大対数尤度は、例えば「10回投げて6回表が出た」コインにおいて最適化された「表が出る確率」と表されることからも分かるとおり、特定の状況(ここでは「10回投げて6回表が出た」)に依存した値になっています。つまり、「最大対数尤度=たまたま得られた観測データへの当てはまりのよさ」であり、「現在観測されている現象をどれだけうまく説明しているか」になります。
一方、上式で表される「バイアス」は、最大対数尤度によって観測データをうまく説明しようとしすぎることに対するペナルティと捉えられます。つまり、AICは、「観測データに依存しすぎることで起こるバイアスを補正したモデルのあてはまりの良さ」といえそうです。

スクリーンショット 2021-02-07 17.50.31

AICの”気持ち”

次に、AICは何を目指した指標なのかを考えます。
結論からいうと、AICは「最もうまく予測するモデル」を追究する指標となります。
先ほどのコインの例で説明します。
「コインを10回投げる」を1セットとし、それを何回か繰り返す状況を想定します。「1セットごとに何回表が出たか」を見ていくと、上のように6回の場合もあれば、2回の場合もあり、10回全て表になる場合もあれば一回も表がでない場合もある、といったように、「10回投げたら6回表が出る」のはある種特殊な状況による結果といえるでしょう。
つまり、次に10回投げて何回表が出るかは一般的にはわからないし、その中で表が出るかどうか予測するためには、そのように表が出る回数が変動することを考慮するべきだということは明白でしょう。
AICは、こうした考慮をバイアス補正という形で補い、一部の特殊な状況に対する過適合を避け、「コインを10回投げる世界全体」をうまく捉えようとしているのです。

スクリーンショット 2021-02-07 18.14.00

AICをどう使うか

上図の通り、AICは「今目の前に現れている現象が属する”世界”を見据える」ものであると私は解釈しました。
最後に、AICをどのように使うべきかを考えます。
なぜそんなことを考えるのか。それは、私が現在主戦場とするマーケティングにおいては、説明のために誤解のない誠実なスタンスをとる必要を感じているからです。具体的にいうと、「どのような構造で予測しているのか」に議論が及びやすい気がする、ということです。
私たちが想定する”構造”は、「現在観測されているデータが表すもの(≒「10回投げて6回表が出るコイン」)」と「それらを内包するより広い”世界”(≒「コイン投げ」)」があります。そして、AICが想定するのは後者です。よって、「今現れている現象を説明」するために得られる結論と、「その現象が属する世界で新たに現れる現象を予測する」ために得られる結論はギャップがあるといえます。このギャップの存在を認識して、どちらの説明をしているのか明確にすることが必要なんじゃないかなと思っています。

この辺りの認識を前提として持ちつつ、次回は実際にデータを触って議論を展開していきたいと思います。
(※なお、ここまで書いた内容は個人的見解です。以下の参考書を一生懸命読んで理解に努めましたが、誤解やより良い解釈などあると思います。よかったら皆さんの見解もコメントで教えてください!)

参考文献

・いつものやつ。そもそも論が好きなのでとても面白い

・言わずと知れた定番書。


この記事が気に入ったらサポートをしてみませんか?