「35万回のコイントスで表が出る確率が51%」なら、1億回コイントスしたら50%になるのか?【100日連続note 24/100】

「PR付きnoteを1時間以内で書く」ことを100日連続で行う、という取り組みを行っています。締切まで55分55秒。
酔っているので正しい記事を書けているかは不明である。頼むぞ俺。

今日はこんなワクワクするニュースを見かけたので、先にご紹介したい。

コイントスは上の方が有利であると言う話

このニュースによると、国際的な研究チームでのべ35万回コイントスを行った結果、上の方が出る確率は50.8%だった、と言うことである。
注:ここでの「上」とは、コインをはじく前に上を向けていた面のことを指す。
これは物理学や数学などの電子ファイルを受け付けているリポジトリ「arXiv」に記事が掲載されている。

このニュースに関しては色々な反応があったようである。Yahoo!ニュースのコメント欄を見てみると、
「35万回しかコイントスをしていないから50.8%になるからであって、1億回やったら50%になるよ」
こんな話がよく見つかった。

しかし、本当にそうだろうか? 今日はこの検証を行なっていきたい。あと45分で解説できるかは不明だが。

大数の法則

統計学の基本の法則に「大数の法則」と言うものがある。これを簡単に説明してみよう。

独立同分布に従う可積分な確率変数列の標本平均は平均に収束する

これが大数の法則だ。
多くの人が何を言っているか分からないと思うし、私自身分からないので、もうちょっと噛み砕いてみよう(厳密性は失われていることに注意)。

試行において、ある事象が起きる確率をpとする。試行回数を限りなく増やしていった時、全体の頻度はほとんど確実にpに等しくなる。

これが大数の法則である。
具体的には、同様に確からしい1〜6の数字が書かれたサイコロをぶん回していったら、「1」が出る確率は試行回数が増えるにつれて1/6に近づく、と言うことだ。

35万回は「大数」ではないのか?

さて、この研究では、35万回あまりのコイントスを行った結果、50.8%程度と言う確率が得られた。一部の声ではもっと試行回数を増やせば50%に落ち着くだろう…と言われているが、いや、35万回ってめちゃ多くない?

このデータの信頼性がどれくらいあるか、を示す指標に「信頼区間」と言うものがある。これについても解説してみよう。

「信頼区間」とは

信頼区間とは、その調査結果がどれくらいの精度なのかを示す数字である。

例えば「95%信頼区間」が20人〜30人、といった数字が出た場合、無作為に同じ標本の数を調べて、100回中95回くらいは20人から30人という結果が出るだろう、と推定されると言うことだ。
(正直この記述は全然自信ない。間違っているかもしれません)

じゃあ、35万回のコイントスにおける95%信頼区間はどれくらいなのか。これも先ほどのarXivに書かれていた。曰く、

50.6%〜50.9%

とのことである。
つまり、35万回のコイントスを行った場合、95%くらいの確度でコインが表を向く確率が「50.6%〜50.9%」に収まる、と言うことになる。

ちなみにこれ、99%信頼区間にしてもそこまで数字は変化しない(50.5%〜51.1%くらい)。なので、

「コイントスの確率は50%で、たまたま35万回の試行の中では偏ってしまっただけ」
と言うよりも
「コイントスの確率は50%よりも高く、35万回の試行の中である程度顕著に見られた」
と考える方が圧倒的に自然である、ということがわかる。

35万回という標本はかなり大きい

なぜ上面の方が出る確率が高いのか、というのは、この研究によると

わずかな歳差運動やぐらつきが生じるから
(回転する物体が回転軸をゆっくりと変えていくから)

と説明しているが、まだ明らかにはなっていない。

そういえば、トリビアの種で日本人全体に関する調査を行うとき
「統計学的に見て2000人のサンプルがあればOK」って
青学の教授が言っていたような気がする。それに比べると35万というのはかなり多いと言えるだろう。

ということで、実際に「コイントスは上面の方が有利である」と言える、と評価したい。
ただ、人によっても確率にバラつきが出たらしく、実験者の癖によって確率が動く可能性もある。
自分でコイントスを何千回かやって、癖を見つけるのもいいかもしれない。

今日のPR

私はセンターの数学2Bをベクトルの代わりに統計で乗り切りました。
統計、超おすすめだぜ!

この記事が気に入ったらサポートをしてみませんか?