陽性反応が本当に病気である確率 「ベイズの定理」
ベイズの定理
ベイズの定理(Bayes' theorem)とは、
ある事象に関連する可能性のある条件についての事前の知識に基づいて、その事象の確率を算出するもの
です。「ベイズの法則」とも呼ばれます。イギリスのトーマス・ベイズ牧師にちなんで名付けられました。
トーマス・ベイツ(1701–1761年)
ベイズの定理は、例えば、健康問題の発生リスクが、年齢とともに増加することが知られている場合、ある年齢の個人のリスクを、単にその個人が集団全体の典型的な例であると仮定するよりも、年齢を条件として、より正確に評価することができます。
数学的な式にすると次のようになります。
AとBは事象であり、P(B)≠0.
•P(A/B)は、条件付き確率であり、Bが真であるときの事象Aが発生する確率.
Bが与えられたときのAの事後確率でもあります.
•P(B/A)も条件付き確率であり、Aが真であるとき、Bが発生する確率.
•P(B/A)=L(A/B)でもあることから、固定されたBに対するAの尤度(ゆうど)とも解釈できます。尤度とは、「もっともらしい度合い」.
•P(A)とP(B)は、与えられた条件なしにAとBがそれぞれ観測される確率です。周辺確率とか事前確率と呼ばれています.
•AとBは別の事象である必要があります.
行動経済学におけるベイズの定理
行動経済学によくでてくるのが基準率(Base rate)。本来の割合です。たとえば全労働者のなかで農業に従事している人の割合や図書館司書の割合があるとき、ある人物が「どんな仕事をしているのか」という確率は、この基準率がそのまま当てはまります。これに新たな証拠があがったとき、それぞれの確率がどう変わるのか、をベイズの定理で算出できます。
例えば、あなたは、大学院生の3%がコンピューターサイエンスを専攻していると考えているとします。それからある大学院生のトムについて、人物を描写する情報を得て、コンピューター・サイエンスを専攻している可能性が、他の分野を専攻している可能性より4倍高いと考えたとします。すると
トムがコンピューター・サイエンスを専攻している確率(事後確率)は、3%→11%になります。
基準率が80%であるなら、事後確率は94.1%になります。
解説
ベイズの定理は、単純化すると
事後確率=事前確率×尤度比
と表すことができます。
トムが、コンピューター・サイエンスを専攻している可能性についてベイズの定理を使ってみましょう。
主観確率3%に対する事前確率は、P(0.03/0.97)=0.031。
人物を描写を聞いて、トムが他の分野よりコンピューターサイエンスを専攻しているである可能性が4倍だと過程すると、尤度(もっともらしさ)は、4となり、
事後確率=事前確率×尤度
なので
事後確率=0.031×4=12.4
となります。ゆえにトムがコンピューター・サイエンスを専攻している可能性(事後確率)は、
12.4/112.4=0.11(※この112.4が分からない)
で11%となる。
例題
あなたの友だちが、ある深刻な病気の検査で陽性反応が出ました。精密検査送りになった人が、実際に病気だった例は600件中に1件でした(事前確率)。検査の的中率は、25 : 1でした。すなわち陽性反応が出て、実際にその病気にかかっている確率は、かかっていない確率の25倍です。
あなたの友人は、精密検査送りになった時点での病気にかかっている確率(事後確率)は1/600。
陽性反応が出たあとの病気にかかっている確率は、25/600。
つまり4%
もう少し理解したい
ということでこちらの動画をみてみました
まず条件付き確率
P(B/A)は、Aが条件。Aが起こった条件のもとでBが起こる確率を示しています。
P(B/A)=P(A,B)/P(A)
P(A,B)は、AかつBが起こる確率
P(A)は、Aが起こる確率
これが、条件付き確率。Aが起こり、かつBも起こる確率です。
AとBを交換します。Bが起こり、且つAが起こる確率。
P(A/B)=P(A,B)/P(B)
P(A,B)を別の表記に変えます。
P(B/A)=P(A,B)/P(A)
だから
P(A,B)=P(B/A)×P(A)
となります。これを代入すると
P(A/B)=P(A,B)/P(B)
が、
P(A/B)=P(B/A)×P(A)/P(B)
となる。これがベイズの定理!
もう1回例題
罹患率0.01%(事前確率)の病気について。この確率は、全対象者のなかで罹患している確率。この病気に対して罹患している人に陽性反応がでる確率が98%でした。罹患しているのに陰性だとでてしまう確率が2%(偽陰性)。
また罹患していない人に陽性反応がでる確率は20%でした。ということは罹患していなくて且つ陰性反応が出た人は80%ということになります。
陽性|陰性
罹 患|98%|2%
非罹患|20%|80%
※太文字が真
この条件下で、Q1:陽性だと診断されて、本当に罹患している確率は?
98%ではない。なぜなら非罹患でも20%も陽性反応が出ているから。
Q1は、因果関係が逆転しています。順当なら病気→診断結果ですが、診断結果から病気の有無を推測するので、結果から原因を推測しています。ゆえにベイズの定理を使います。ベイズの定理は、結果から原因を推測する定理。
ベイズの定理
P(A/B)=P(B/A)×P(A)/P(B)
これにこの問題を当てはめていきます。
P(罹患/陽性)=P(陽性/罹患)×P(罹患)/P(陽性)
このように逆確率を順方向の確率から計算できるのがベイズの定理。
計算してみましょう。
P(罹患/陽性)=P(陽性/罹患)×P(罹患)/P(陽性)
P(陽性/罹患)=0.98
P(罹患)=0.0001
P(陽性)=これは、2つのパターンがあります。罹患していて陽性になる場合(A)と罹患していないのに陽性(B)になる場合。なので2つの確率を計算する。
P(陽性)=A+B
なので
P(陽性)=0.0001×0.98+0.9999×0.2
となる。ゆえに
P(陽性)=0.000098+0.19998=0.200078
ということで
P(罹患/陽性)=P(陽性/罹患)×P(罹患)/P(陽性)
を計算していくと
P(罹患/陽性)=0.98×0.0001/0.200078=0.0004898
よって0.04898%≒0.05%
ということで、Q1:陽性だと診断されて、本当に罹患している確率は0.05%
まとめ
事前確率が0.01%
検査をした結果、陽性だったという情報が入ってきた。その結果、罹患している可能性が0.01%から0.05%に上がったということ。
事後確率が0.05%
になったということ。
確率の更新プロセス、これが逐次ベイズ推定。
認知バイアス
認知バイアスとは進化の過程で得た武器のバグの部分。紹介した認知バイアスは、スズキアキラの「認知バイアス大全」にまとめていきます。
フォロー&「いいね!」をよろしくお願いします。
スズキアキラのnoteでは、ビジネスに役立つエビデンスを紹介しています。おもしろい!と思っていただければ、なにとぞ「フォロー」や「いいね!」をお願いします。
参照
※1:ベイズの定理
この記事が気に入ったらサポートをしてみませんか?