確率が測れない例
abstract : このnoteでは、確率が測れない例(要するに事象でない例)を紹介します。区間[0, 1]上に一様分布を考えたとき、確率P[A]が考えられないような集合 A⊂[0, 1] の例を一つだけ挙げます。
1. Introduction
区間[0, 1]上に次のような確率分布を考えます。区間 [a, b]⊂[0, 1] に含まれる値が観測される確率をP[[a, b]]と書き、P[[a, b]] = b-a と定義します。例えば
・P[[0.0, 0.5]] = 0.5-0.0 = 0.5
・cは0以上1以下の実数とします。P[{c}] = P[[c, c]] = 0
です。
さて、より一般の集合 A⊂[0, 1] についても確率P[A]を定義することを目指します。確率は次のような性質を満たすものだとしましょう :
1. P[[0, 1]] = 1
2. P[A^c] = 1 - P[A] ... ただしA^cはAの補集合とします。
3. A_1, A_2, A_3, ... が A_i∩A_j=∅, (i≠j) ならば P[∪A_i] = ΣP[A_i]
2は余事象に対する確率の性質、3は和の法則と呼ばれるものです。なお、∅は空集合{}のこととします。
この定義を採用すれば、例えば次のような集合に対しても確率を計算できるようになります。
・P[(0.5, 1.0]] = 1-P[[0.0, 0.5]] = 1-0.5 = 0.5
・P[[0.0, 0.2]∪[0.3. 1.0]] = P[[0.0, 0.2]]+P[[0.3, 1.0]] = 0.2+0.7 = 0.9
・P[(0.2, 0.3)] = 1-P[[0.0, 0.2]∪[0.3. 1.0]] = 1-0.9 = 0.1
・A = 0以上1以下の有理数全体 ならば P[A] = 0
最後の例は和の法則から従います。ちょっと難しかったかもしれませんが、認めて次に進みましょう。(「可算」というキーワードを調べると良いです。)
今回興味のある問題は、どんな集合A⊂[0, 1]に対しても上記の方法で確率を計算するとしたとき、矛盾が起こったりしないのかということです。結論から言うと起こります。そして、この問題を避けるうえで役に立つ概念が「事象」であることを説明します。
2. 確率が測れない集合のレシピ
[x] = { y∈[0, 1] | y-xは有理数 }を考えます。これは実数xと同値類の集合と呼ばれるものです。例えば、
・[√2] ≠ [π](∵ π-√2が有理数ではないからです。)
・[√2-1] = [√2]
です。さて、考えうる同値類[x]たちから1つずつ要素をとってくると、区間[0, 1]の部分集合を作ることが出来ます。この集合をAと呼ぶことにしましょう。(厳密性のための注意 : このような操作を行ってよいのは「選択公理」のためです。)さて、以下の定理を示すことが、このnoteの目標です。
定理 : 集合Aの確率が測れるとすると、上記の確率の定義に矛盾する。
3. 証明
A_p = { x | x = p+aの小数部分, a∈A } という集合を導入します。以下の補題1と補題2から、A_p∩A_q=∅ (p≠q) かつ [0, 1)=∪A_p(ただしpは0以上1未満の実数)が成り立つことが大切です。
補題1 : p, qを0以上1未満の有理数とします。p≠q ならば A_p∩A_q=∅ である。
証明 : 対偶を示しましょう。A_p∩A_q≠∅ とします。要素 z∈A_p∩A_q を取ることが出来て、Aの要素a, a'および整数r, r'によって z = p+a-r = q+a'-r' の小数部分 が成り立ちます。これから a-a' = (q+r')-(q+r) が成り立ちます。右辺の形から a-a' が有理数だとわかりますが、これは集合Aの定義から a=a' を意味します。すなわち p-q は整数であることが分かりますが、-1<p-q<1 なので p-q=0 が従います。■
補題2 : 0以上1未満の実数rは、ある0以上1未満の有理数pがあって r∈A_p を満たす。
証明 : 集合Aの要素aを、a∈[r]を満たすように取ります。注意として、集合Aの定義から0≦a≦1です。r-a≧0 のときは p=r-a とすれば、pは0以上1未満の有理数で r=p+a が成り立ちます。r-a<0 のときは p=1+r-a とすれば、 pは0以上1未満の有理数で r = p+aの小数部分 が成り立ちます。■
さて、集合Aの確率が測れるとし、0以上1以下の実数cによって P[A]=c と書きしょう。和の法則を用いると
P[[0, 1)] = ΣP[A_p](ただしpは0以上1未満の有理数)
です。確率の定義の仕方から P[A]=P[A_p] が成り立つことに注意すると
P[[0, 1)]
= ΣP[A](ただしΣの添え字pは0以上1未満の有理数)
= +∞ or 0
が成り立ちます。しかし余事象の確率の計算を用いると、P[[0, 1)] = 1-P[{1}] = 1-0 = 1 とも計算できるので、これは矛盾です。
4. 事象の導入
上の例は、区間[0, 1]上の部分集合がいつでも確率が測れるとは限らないことを意味しています。そこで、実際には確率を定義するような区間[0, 1]の部分集合を制限する必要があります。
そこで登場するのが事象です。
定義 : 区間[0, 1]の部分集合からいくつか要素を選んで作った集合をℰと書くことにします。集合ℰが次の3条件を満たすとき、集合ℰを完全加法族といい、その要素を事象といいます。
1. [0, 1]∈ℰ
2. E∈ℰ ⇒ E^c∈ℰ
3. E_1, E_2, E_3, ... ∈ℰ ⇒ ∪E_i ∈ℰ
条件1は「全事象の確率は測れてほしいな」、条件2は「余事象の確率は測れてほしいな」、条件3は「和事象の確率は測れてほしいな」という要望に対応します。なお、積事象に対応する条件
・E_1, E_2, E_3, ... ∈ℰ ⇒ ∩E_i ∈ℰ
は、条件2と条件3から示すことが可能です。(ここでは示しません。興味がある方はド・モルガンの法則を上手く使うことを考えてみてください。)
そして事象という概念を用いて、確率の定義を次のように修正します。
定義 : 区間[0, 1]とその上の完全加法族ℰに対して、以下の条件を満たすような関数 P : ℰ→ [0, 1]を確率という。
1. P[[0, 1]] = 1
2. A∈ℰならば P[A^c] = 1 - P[A]
3. A_1, A_2, A_3, ... ∈ℰ が A_i∩A_j=∅, (i≠j) ならば P[∪A_i] = ΣP[A_i]
実は、区間 [a, b]⊂[0, 1] を含むような最も小さい完全加法族ℬに対しては、P[[a, b]] = b-a を満たすような確率Pが定まることが証明できます。この証明には「カラテオドリの拡張定理」と呼ばれるものを用いますが、本題から逸れるのでこの辺りで解説を終わりたいと思います。
acknowledgement : このnoteは、株式会社すうがくぶんかの集団授業「数理統計学」にて質問を受けた内容への回答です。質問をしてくださった生徒さんに感謝申し上げます。
サポートをいただいた場合、新たに記事を書く際に勉強する書籍や筆記用具などを買うお金に使おうと思いますm(_ _)m