見出し画像

明日の朝も生きて目覚める確率(feat.ベイズの定理)

高校の卒業文集に「全ての確率は1/2だ。」と書いた友達がいました。ある出来事が起こるか起こらないかは、起こったかどうかという事後の結果からしか分からないんだから事前にその確率について考えてどうする、というユーモアです。なぜか今朝起きた時にふとこんなことを思い出したので、この「全ての確率は1/2理論」とベイズの定理を使って明日も生きて目覚める確率について考えてみたいと思います。

ベイズの定理-公式

今回のアプローチ

ベイズの定理の肝は、「新しい情報を得る度に信念を更新する」ことです。なので、「明日も生きている確率は生きるか死ぬかだから1/2だ」という明日も目覚めることに対しての信念を、「今まで自分は毎日死なずに生きてきた」という情報を考慮することによってアップデートしていくというアプローチを使っていく方針で行きたいと思います。

準備

  • p(明日も目覚める) = θ とする

  • p(θ)を使ってθに対する確信度合い(これが信念の意味)を計る。

  • 上のベイズの定理の画像のとおり、p(θ)がxという情報(今回は「今まで生きてきた」という情報がxにあたる)によってアップデートされて最終的に知りたい確率p(θ|x)となる。

  • またここでは、生まれた日から時系列で一日目に生きていた、二日目も生きていた、、、n日目も生きていた、という具合で順に確率をアップデートしていく手法をとりたいと思います。

繰り返しますが、p(θ)をP(θ|x)の形にアップデートすることがベイズの定理の意味です。ちなみに、p(θ)を事前分布、p(θ|x)を事後分布といいます。また、アップデートは何回でもできます。つまり、p(θ|x)を新たなp(θ)として同じ手続きを踏めばよいわけです。

「全ての確率は1/2理論」はある意味正しい - 一様分布(Uniform Distribution)する事前分布の仮定

人生一回目の夜から目覚めて生きている確率を考えるとき、つまり、過去の情報を参照できないとき、目覚めるまでに何があるか分からないのだからあらゆる可能性を等しく評価するのがよいだろうとすると、p(θ)は、

$$
p(\theta) =1,  \theta \in [0,1]
$$

と表現できます。θは確率なのでθは0から1の間の値しか取りません。また、p(θ)は確率密度関数なのでθのとる範囲で積分した時に1にならねばなりません。今回はすべての可能性を等しく評価することにしたので、あらゆるθに対してp(θ)に1を課すことになります。横と縦の長さが両方1の正方形の面積は1ですよね。これで事前分布p(θ)については記述できました。

この事前確率p(θ)を用いて今まで生きてきたという情報を考慮する前に考えられる明日も生きている確率を計算してみると、

$$
P(\text{{明日も生きている}}) \\
= \int_{0}^{1} p(\text{{明日も生きている|θ}}) \cdot p(\theta) d\theta  \\
= \int_{0}^{1} \theta \cdot 1 d\theta \\
= \frac{1}{2}
$$

となり、なんと「全ての確率は1/2理論」が論理的に導けました。情報が何もない時、「全ての確率が1/2理論」は妥当と言えます。では、次のセクションからこの事前分布をアップデートする作業を見ていきましょう。

「全ての確率は1/2理論」のアップデート

一気に今まで生きて目覚めた回数分の情報を反映させることはせずに、1日分ずつ段階的にアップデートさせていきます。

一回目

まずは、人生2日目に生きて目覚めていた、という情報を反映させていきます。この観測の情報を適当に$${a_1}$$とします。ここで、aの右下の添え字が2ではなくて1なのは、二日目に生きているということは一日目の夜から目覚めた時に生きていた、という意味を表しています。すると、アップデートされた後の確率は$${p(\theta | a_1 )}$$となります。ベイズの定理を用いて、

$$
p(\theta | a_1 ) \\
=\frac{p(a_1 | \theta) \cdot p(\theta)}{p(a_1)}\\
= \frac {\theta \cdot 1}{\frac{1}{2}}  \\
= 2\theta
$$

と書けます。3日目も生きていた、という情報を$$a_2$$としましょう。そうすると自ずと$${p(a_2|a_1)}$$が知りたい情報となるでしょう。以下のように計算していくと、

$$
p(a_2|a_1) \\
= p(a_2|a_1) \cdot \int_{0}^{1} p(\theta | a_1) d\theta \quad \text{(この二項目の積分は1となる)}  \\
= \int_{0}^{1} p(a_2|a_1) p(\theta|a_1) d\theta \\
= \int_{0}^{1} p(a_2) p(\theta|a_1) d\theta \quad (a_2\text{は} \theta  \text{の下で}a_1 \text{と独立。つまり}a_1\text{を知ることは} a_2 \text{を知ることに関して無意味)} \\
=\int_{0}^{1} \theta \cdot 2\theta d\theta \\
=\frac{2}{3}
$$

2回目

3日目の朝に生きて目覚めた確率を反映させていきます。今回は反映させるべき過去の情報が$${a_1}$$と$${a_2}$$の二つあるので、知るべき事後確率は$${ p(\theta|a_1, a_2) }$$となります。1回目のアップデートと同様に考えると、

$$
p(\theta|a_1, a_2) \\
=\frac{p(a_2|\theta. a_1)\cdot p(\theta|a_1)}{p(a_2|a_1)}\\
=\frac{\theta \cdot 2 \theta}{\frac{2}{3}}\\
=3\theta^2
$$

が得られます。3回目の睡眠から目覚めてもまだ生きていたという確率は$${ p(a_3|a_1, a_2) }$$となりますが、これを先程と同様に以下のように計算していくと、

$$
p(a_3|a_1, a_2) \\
= \int_{0}^{1} p(a_3|a_1, a_2)p(\theta|a_1, a_2)d\theta  \\
=\int_{0}^{1} p(a_3)p(\theta|a_1, a_2)d\theta \\
=\int_{0}^{1} \theta \cdot 3\theta d\theta \\
= \frac{3}{4}
$$

という結果が得られます。

N回目のアップデートの結果

これをN回繰り返すと、$${ \frac{N+1}{N+2} }$$という結果が得られます。僕は20年と20日前に生まれたので、今まで$${365*15 + 366*5 + 20 = 7325}$$日間生きて目覚めてきた分のアップデートができます。なので、明日も僕が生きて目覚める確率は,$${\frac{7325+1}{7325+2} = 0.99986352}$$の確率で明日の朝も目覚めることができるということです。

「全ての確率は1/2理論」から出発して、「明日目覚める確率も50%だ」という信念を、ベイズの定理をもちいることで「明日も目覚めることができる確率は99.986352%」だという信念にアップデートすることができました。「全ての確率は1/2理論」よりはもっともらしく聞こえるのではないでしょうか。

最後にN回目のアップデートの結果である$${\frac{N+1}{N+2}}$$の証明を書いておきます。

$${\frac{N+1}{N+2}}$$の証明 -数学的帰納法

N回目のアップデートの後の確率が$${\frac{N+1}{N+2}}$$であるならばN+1回のアップデート後の確率が$${\frac{N+2}{N+3}}$$だと示すことができればよいでしょう。

$$
p(\theta | a_1, … , a_{N+1}) \\
= \frac{p(a_{N+1}|\theta, a_1, … , a_N)p(\theta|a_1, … , a_{N}))}{p(a_{N+1}|a_1, … , a_{N})} \\
=\frac{\theta\cdot {(N+1)}\theta^{N}}{\frac{N+1}{N+2}} \\
= (N+2)\theta^{N+1}
$$

$$
p(a_{N+2}|a_1, … , a_N+1) \\
= \int_{0}^{1}p(a_{N+2})p(\theta|a_1, … , a_{N+1}) \\
= \int_{0}^{1}\theta\cdot  (N+2)\theta^{N+1} \\
\frac{X+2}{X+3}
$$

これで示せましたね。本来はラプラスの"rule of succession"という論法を使って証明する必要があるのですが、今回は簡単のため、$${\frac{N+1}{N+2}}$$を予想してその確認の証明をした、という態でいきました。

僕の暇つぶしの記事を読んでくれた皆さん、ありがとうございました。もう少し面白いことを書けるように頑張ります。

この記事が気に入ったらサポートをしてみませんか?