見出し画像

ベイズの定理について考えてみる

こんにちは、あーるです。
今日は育児とは全く関係のない私の趣味の数学の話になります。
稚拙なレベルですが、お好きな方はお付き合いください。
数学について詳しくない人でも理解しやすいように、例を交えながらなるべく分かりやすく記述していこうと思います。

唐突ですが、確率の話です。ベイズの定理です。
ベイズという単語を聞くと、なんだか難しいなあと思ってしまうのですが、初歩的なものですので、がんばっていきましょう。

画像1

よく聞く方もいらっしゃるのではないでしょうか。おそらく大学で数学系の授業を履修された方は習ったことがあるかもしれません。しかし、式だけなんとなく知っていて、意味がわからなかったり、さっと使えなかったりする方も多いかと思います。恥ずかしながら、わたしもその一人です。

今から式の中身を一緒に追っていきましょう。

前提となる設定

確率変数は、「X」と「Y」とします。
Xが取りうる確率事象を「A_i」、Yが取りうる確率事象を「B_j」とします。(iとjは添字です。)
P(X=A_i)は、「XがA_iである確率」を意味します。(事前確率です。)
P(X=A_i|Y=B_j)は、「YがB_jであると分かっているときのXがA_iである確率」を意味します。(事後確率(条件付き確率)です。)

こう並べてもわかりにくいかもしれないので、具体例を書いてみます。
わたしは違うのですが、よく、天気が悪いと頭痛が起こる(偏頭痛?)という方を見かけます。その例で考えてみましょう。

Xを頭痛、Yを天気で考えます。
そして、X={A_1=起こる, A_2=起こらない}、Y={B_1=晴れ, B_2=くもり, B_3=雨}とします。
このとき、P(X=A_1)は、「頭痛が起こる確率」を意味します。
また、P(X=A_1|Y=B_2)は、「天気がくもりであると分かっているときの頭痛が起こる確率」を意味します。

P(Y=B_2|X=A_1)で考える

いよいよベイズの定理の式の中身を見ていきましょう。
確率事象をA_iやB_jで考えるとやや抽象的なので、ここでは上の偏頭痛の例を使って、P(Y=B_2|X=A_1)に注目して考えていきましょう。
これが分かれば、一般のP(Y=B_j|X=A_i)についても同様に理解できるのでご安心を。

P(Y=B_2|X=A_1)は、「頭痛が起こると分かっているときに天気がくもりである確率」になります。これが今回知りたい確率であり、周りの分かっている情報を使って、この確率を求めていくというのがベイズの定理の使い道になります。

さて、次の図をご覧ください。

画像2

今回、分かっている周りの情報として、P(X=A_1)、P(Y=B_2)、(*)=P(X=A_1∧Y=B_2)があるとします。これらを使って、P(Y=B_2|X=A_1)を求めていきます。
ちなみに、(*)=P(X=A_1∧Y=B_2)は、「XがA_1であり、かつ、YがB_2である確率」を表しています。(同時確率です。)
例になぞると、「頭痛が起こり、かつ、天気がくもりである確率」になります。
P(X=A_1|Y=B_2)やP(Y=B_2|X=A_1)と似ているのですが、文字にしてみると意味が異なるのが分かるかと思います。

たびたび書きますが、今回は、P(Y=B_2|X=A_1)を求めるので、XがA_1となる場合にフォーカスしていきます。

画像5

図内にも書いたとおり、P(Y=B_2|X=A_1)は、「XがA_1となる確率のうち、XがA_1かつYがB_2になる確率」を求めることと等価になります。

すこし話が反れますが、小学校?中学校?でも習った通り、確率は、(!!!正しくは確率と割合とは異なるのですが!!!)「全体集合のうち、特定の事象がおこる割合」と考えると理解しやすいかと思います。

話を戻します。"確率 分の 確率" になり、わかりにくいとは思うのですが、P(Y=B_2|X=A_1)では、確率でいうところの全体集合を「X=A_1のとき」に置き換えるイメージになります。考える範囲を狭めますよーという感じです。

さてさて、(*)の部分は下記(a)や(b)のように表すことができます。

画像3

(*)は、「頭痛が起こり、かつ、天気がくもりである確率」です。
(a)と(b)の読み方は、上記図内の①②③の順に読んでみてください。
(a)は、「天気がくもりであり、かつ、天気がくもりであると分かっているときに頭痛が起こる確率」であり、(b)は、「頭痛が起こっていて、かつ、頭痛が起こっていると分かっているときに天気がくもりである確率」になります。

言葉で書くとわかりやすいかなと思ったのですが、わかりにくいですね...。
とにもかくにも(*)と(a)と(b)は同じ意味になります。(諦めた...笑)

あとは、P(Y=B_2|X=A_1)=(*)/P(X=A_1)の式へ (a)を当てはめると、めでたく P(Y=B_2|X=A_1)=P(X=A_1|Y=B_2)P(Y=B_2)/P(X=A_1) という式(ベイズの定理)が導くことができます。

ちなみに、P(Y=B_2|X=A_1)=(*)/P(X=A_1)の式へ (b)を当てはめると、単にP(Y=B_2|X=A_1)=P(Y=B_2|X=A_1)となります。

結局何が言いたかったのか

「頭痛が起こる確率」、「くもりになる確率」、「くもりのときに頭痛になる確率」は分かるけど、「頭痛のときにくもりである確率」がわからないので、分かる情報を使って知りたいなーと思ったときに使える定理ということでした。

あとがき

結局なんだか書いてみてもぐだぐだになってしまいましたが、久しぶりにこういうことを考えることができて楽しかったです。

お付き合いいただき、ありがとうございました。

サポートいただけると嬉しいですが、スキをしていただけるだけでもとても嬉しいです!