納得への旅1 (モンティ・ホール問題)

自分が今まで何度も説明を読んだのに理解できてないことを、これから1時間以内に納得してきます。

第1回はモンティ・ホール問題です。

シリーズ化できるほど他に問題があるかというと、まだ第2回までしか思いついてません。募集。

自分の選んだ扉が正解の確率は1/3。外れの確率は2/3。
選択後、非選択のうち一つの外れが消去される。
自分の選んだ扉が正解の確率は1/3。外れの確率は2/3。で変わらない。
ならば、今の選択を辞めることで、正解の確率が高まる。

↑この、確率が変動しないことに納得がいかない。
外れが消去されたらその時点で50:50に変わるんじゃないのか?と思っちゃう。

確率という無形のものは、観測者の設定した条件によって定義されてる。
条件が変動したなら確率が変動してもおかしくない。

むろん、確率に影響がある領域の条件と、そうでない条件がなんらか区別されうることは想像できる。
そこを明確につかみたい。

「選択と、その時点での条件によって確率は決まるんだから、あとから状況が変わったことで確率は変動しないだろ」ってのも薄ぼんやり頷きそうになる。
でもじゃあ、残った扉の正解確率が2倍になるのも変じゃない?とつっかえちゃう。

あと、プログラムで大量に試行してみたとき、実際に想定通りになるのも、「やっぱそうなんだあ〜」と思える。
だがそれだけでは、「なんで?」は消えない。

「50:50に変動する」という考え方は……

選:残:残 = 1:1:1であるなら、
選:消:残 = 1:1:1であり、
選:_:残 = 1:_:1だから、
全体集合を1と捉え直すと、50%:50%だという直感。

この「比率こそが不変である」みたいのは、濃度計算とかでは正しいんだけど、確率ではバグるんだろうなって臭いを感じている

「残った扉が2倍当たりやすくなる」のがこの問題の一番気持ち悪いポイントだからな〜

まさにこの「確率は固定される」が全然意味わからなかったので、否定されてるのデカい

ただそのベイズの定理を体感しないと納得には至らないな。でもなんか数式の話はむずそうだから一旦別の見よっと

ヨビノリ氏は何度か動画観たことあるし、不誠実な印象が無いから、まずここから信用して観てみよう

5:30くらいまでみた

扉100枚バージョンの例 (外れを98枚開いたあと) も、残った2枚は50%ずつに感じてしまうな

司会者が正解を知っているという前提だとしても、「おれが正解を選んでいて、残る99枚の外れから98枚の外れを開いたこと」と「おれが外れを選んでいて、残る99枚から正解1枚以外の外れ98枚を正確に開いたこと」の差にピンとこない

最後までみた

「必ず変える」という前提で全パターン追えば、わかるでしょ、という説明の方法だった
たしかにそのとおりなので、納得できた

この説明から行けば、逆に考えれば「必ず変えない」という前提の時に、確率が変わらないことも納得できるし、補集合として「必ず変える」ときに正解確率2/3が1枚の扉に集約される感じもわかる

「確率が変わらない」が先に立って説明されるのではなく、「結果的に変わらないことがわかる」の順序だったので、よかった
「司会者がテキトーに開いたら、途中から確率も変わるよね」ってのも、そうだよね。変わるよね。

なんかまだ小骨が引っかかってる気もするが、一旦腑に落ちた
もう少し探してみよう

あーなんか、自分で説明を考えうる気がしてきた

3つの扉があります。
正解は1つです。
αさんは1つ選びます。勝ち確率1/3です。
βさんは残りの2つを選びます。1つでも正解を含めば勝ちとします。勝ち確率2/3です。
司会者がβさんの扉のうち外れをひとつ開けます。
αさんもβさんも選択は変えません。
βさんは開いてる閉じてるにかかわらず、正解の扉があったら勝ちです。
さて、両者の勝ち確率はどうなっているでしょう。

こうなら、最後までいっても、αは1/3、βは2/3になる気がするよな

これのミソは、最後まで3つの扉が生きてるってとこ
これがおれの納得にはキく

βは2枚の扉を持っていて、どっちかが正解ならよくて、絶対に最低1枚は外れなことは最初からわかっているし、それを司会者が公開情報にしようがしまいが確率には関係ない

この変形した問題設定なら、納得できた
じゃあ元のモンティ・ホール問題に違和感なく戻せるのか?

"選択を変えなかったとき"が"α"と同じ。これはいい

"選択を変えたとき"は"β"と同じと言えるか?
「他の2枚の扉、両方選んでいいよ (ただし1枚は外れ確定が公開済み)」
「他の2枚の扉、1枚選んでいいよ (もう1枚は外れ確定が公開済み)」
これは同じだね。

じゃあ、いいじゃん。やった〜

まてまて、それじゃ、最初に読んだNABENAVI氏のブログと齟齬が生まれるんじゃないか?

A,B,Cのドアがあり、どれか1つが当たりだとします。ただし、Aのドアは当たりやすく当たる確率は0.5、Bは当たりにくく当たる確率は0.2、Cは0.3であるとします。

司会者がCのドアを開けてハズレであることを示すと、 Aのドアのままだと当たる確率は5/9、Bに変えると当たる確率は4/9です。この場合は、ドアを変えない方が良いのです。つまり、この場合は「司会者がBのドアを開けたときはCに変えたほうが良く、Cのドアを開けたときはAのドアのままが良い」です。

http://nabenavi.net/montyhall/

うーん多分、「おれの変形例では、司会者の振る舞いは確率に影響しないけど、だからといって同じ理屈を「元のモンティ・ホール問題に違和感なく戻」すとバグる」、という気がした。
ほんとか? うーんうーん……

扉の正解率がそれぞれ異なるのってモンティ・ホール問題の拡張版なので、あくまで元のモンティ・ホール問題を考える上では「一般的に、後からの情報は確率に影響することがない……ってのはウソだぜ」「正確なところは計算で出せるぜ」を理解するためにあると捉えるべきだな。

じゃあ、ベイズの定理の方も学ぼう

この序盤に出てくる図はわかりやすいな〜

単純に式変形であるってことも簡単に理解できるし、変形後の式の意味も肌でわかった

「結果が決まったとき、前提が特定のコレである確率」は、
「その前提を選び、かつその結果が出る確率」/「各前提パターンにおいて、その結果が出る確率、の総和」だと。
うんうん

じゃあ実際に計算してみるか

まずさっきのブログの、「A,B,Cの各正解率が0.5, 0.2, 0.3である」「Aを選んだ」のとき、Bが開いて、Aが正解の確率は……

事象A: Bが開けられた
事象B1: Aが当たりだった
事象B2: Cが当たりだった

P(B1|A) = P(B1) * P(A|B1) / {P(B1) * P(A|B1) + P(B2) * P(A|B2)}
= 0.5 * 1/2 / (0.5 * 1/2 + 0.3 * 1)
= 5/11

A正解は5/11。余事象のC正解は6/11。
Cに変えたほうがいいですね
ブログの答えとも合ってる

元のモンティ・ホール問題は、すべての扉の正解率が1/3で、

事象A: Bが開けられた
事象B1: Aが当たりだった
事象B2: Cが当たりだった

P(B1|A) = P(B1) * P(A|B1) / {P(B1) * P(A|B1) + P(B2) * P(A|B2)}
= 1/3 * 1/2 / (1/3 * 1/2 + 1/3 * 1)
= 1/3

A正解は1/3。C正解は2/3。
Cに変えたほうがいいですね

計算でもまあわかった。

やっぱ、P(A|Bk)が入ってくるところがミソなんだなあ
最初に選んだ扉が正解だったときはここで1/2をかけてるけど、外れだったときは必ずもう一つの外れが開くので、1をかける。
両方同じ値だったら計算結果は50:50になる。違う値だからそうならない。

これはまさにヨビノリ氏が言ってた「モンティは正解を知っていることが大事。知らずにランダムに選んでたら50:50になっちゃう」が計算式上でも感じられた。

腑に落ちましたか? はいまあ……

なんか、わかったけど、たとえば1週間後にも「わかった」気が持続するかなあ?

正解の正しさはめっちゃガツンとわかったわけではないけど、それまで自分の思ってた「50:50になるくない!?」っていう謎の誤った自信はかなり減退したから、まあよかったかな。


おわり

投げ銭いただけたら、執筆頻度が上がるかもしれません