見出し画像

ベイズ推論は全人類が学ぶべき理性の道具?

最近確率や統計なんかを勉強しようと思って少しづつ本を読み始めたところですが、その中で出てきたベイズの定理が気になっています。

初めは
【異端の統計学 ベイズ】(著者 シャロン・バーチェ・マグレイン)
を読みました。こちらはベイズの定理の歴史をなぞるもので、式は色々でてきますが、ベイズの定理についての基礎知識が無いと、なかなか難しかったです。

次に読んだのが
【人はどこまで合理的か】(著者 スティーブン・ピンカー)
で、こちらはとても良くまとまっていてすごく分かりやすかったです。

今回は主に【人はどこまで合理的か】の内容からベイズの定理について考えてみます。
(この先ベイズの定理やベイズの法則、ベイズ推論といった言葉が出てきますが、基本的には同じ意味だと考えてください。)

ベイズの定理って何?

ベイズの定理もしくはベイズの法則とは、

"何かに関する最初の考えを新たに得られた客観的情報に基づいて更新すると、それまでとは異なるより質の高い意見が得られる"(異端の統計学 ベイズより引用)
というものです。

これだけだと何かよくわからない感じですが、例えばこのように考えればどうでしょうか。

あるお店で、新作のラーメンが発表されたとします。このラーメンが
美味しい可能性はどのくらいでしょうか?

①まず何も情報が無い状態だと、食べてみるまでわからない、つまり50%の確率で美味しいと言えます。

②でもラーメンです。ラーメンはだいたい美味しいと考えると、もしかしたら美味しい確率は70%と考えてもいいかもしれません。

③でもその新作ラーメンを発表したお店が、とんかつ屋だったら?とんかつ屋が初めて出すラーメンは美味しいのか?もしかしたら30%の確率くらいかもしれません。

このように、新しく加えられた情報から確率を更新していくのがベイズの定理の基本的な考えです。
ところで、①②③について、確率の出し方がかなり主観的じゃないかと思われた方がいるかもしれません。
正にこの主観的が原因で、ベイズの定理は長らく異端と考えられてきました。(参照:異端の統計学 ベイズ)
ただ現実世界では全てのデータがそろっていることなどほぼ無く、今ある知識や情報を利用するしかありません。計算が複雑になるの実際にベイズの定理を使えるようになるにはコンピューターの誕生を待つしかありませんでしたが、コンピューターの誕生と共に、この数十年間で科学のあらゆる分野に広がっていったということです。

ベイズ推論の模範例

ここからは実際にベイズの定理を使って確率がどのように変化するのか、例題を見ながら考えてみます。(参照:人はどこまで合理的か)

ある地域の女性人口(母集団)の乳癌有病率が1パーセントだとする。そしてある乳癌検査の感度(真陽性率)が90パーセント、偽陽性率は9パーセントだとする。
ある女性が検査で陽性になった。この女性が乳癌である可能性はどれくらいだろうか?

答え:9%

多くの人は90%だと考えたのではないでしょうか。実際にこの問題を医師に出したところ、80~90%という答えが最も多かったそうです。

では、なぜ9%になるか見ていきましょう。

まずはベイズの定理を使って計算してみます。(ここでは式の説明はしないで、とりあえず書いてみます。)

ベイズの定理的に考えると、まず有病率だけで考えると、ある女性が乳癌に罹患している確率は1%(有病率)。
そこに、検査結果という新たな情報が加わりました。
それにより確率を更新し、9%という数字を得ました。

ところで、多くの人が90%だと考えたのはなぜでしょうか?
それは、ある乳癌検査の感度(真陽性率)が90%であったため、
乳癌検査で陽性となったので、90%の確率で乳癌であると考えたということです。
一見これで間違っていないような気がするのですが、何がダメなのでしょうか。
それは、"偽陽性率は9%"であることを考えていないからです。
分かりやすくするために、ここからは図を使って考えてみます。

わかりやすくするために、1000人の女性サンプルで考えてみます。
1000人のうち、10人が乳癌に罹患している。(有病率1% 1000人×1%=10人)

この10人のうち、9人が検査で陽性になる(真陽性率90% 10人×90%=9人)
罹患していない990人のうち、89人が陽性となる(偽陽性率9%  990人×9%=89人)

では検査で陽性になった人の内、実際に罹患しているのは?
検査で陽性になるのは98人(9人+89人)で、実際に罹患しているのは9人。
9÷98=約9%
これが答えです。

これは問題を頻度で考える方法です。
小数点を使った式で考えると分かりずらいですが、
数字を大きくしたり図を使ってみると直感的に理解できるようになります。

ベイズの定理を学ぶと何が変わる?

ベイズの定理とは
"何かに関する最初の考えを新たに得られた客観的情報に基づいて更新すると、それまでとは異なるより質の高い意見が得られる"
というものでした。

乳癌の罹患率の話では、事前にわかっている情報(その地域の罹患率1%)を取り入れることで、検査の陽性率(90%)に引っ張られることなく、より正しい確率(9%)を求めることができました。

例えば公共政策を決める場合、または私たちが選択する場合、9%と90%ではおそらく答えが全然違ってくるでしょう。

私たちが生きている世界は不確かな事ばかりですが、ベイズの定理は私たちが何かを判断するとき、よりマシな判断を下せるようになる手助けをしてくれるのではないでしょうか。


この記事が気に入ったらサポートをしてみませんか?