統計的な推測~いよいよ仮説検定だ!
Cover Photo by Christopher Burns on Unsplash
統計的仮説検定(帰無仮説検定)
「解説」に掲げられている、指導要領の内容について、一部を再掲します。
前回までに、確率変数と確率分布について、二項分布と正規分布について書いてきました。残るは、区間推定と仮説検定です。今回は仮説検定について書いておきます。
統計的仮説検定、あるいは帰無仮説検定、というのが正しい(?)名称です。名称からわかる通り、鍵を握るのは「帰無仮説」の設定です。帰無仮説が妥当であるかどうかを検定するのでこの名前があると理解しています。
仮説検定の手順
「解説」では、「一般に,仮説検定は次のような手順で行われる」として、次の手順を示しています。
この説明には、少々ひっかかりがあります。次の部分です。「統計的に実証したい仮説H1(対立仮説)を立て,その否定命題としての帰無仮説H0を考える」。
私がもっとも信頼する教科書「心理学統計法’21」(清水, 2021)には、こう書いてあります。
違いが伝わったでしょうか。次の部分です。「対立仮説は(中略)必ず帰無仮説の否定で表されます。」
お互いに相手の否定形で表されるのだから、どっちだって同じことを言っているだろう、とも考えられます。でも、ちょっとまってください。これは書き方の問題ではなく、仮説を設定するときの考え方の問題です。「解説」に掲げられている次の例題をもとに考えましょう。
例題:このコインには偏りがないか
例題はこうです。
この例題で、帰無仮説、対立仮説はどうなるのでしょうか。「解説」で解説されているとおりに考えると、まず「表の出る確率>裏の出る確率」が対立仮説となるように思えます。するとその否定は、「表の出る確率≦裏の出る確率」となります。
ですが、「解説」にはそうは書いてありません。「統計的に実証したい仮説「表の出る確率と裏の出る確率は等しくない」(対立仮説H1)を立て,その否定命題である「表と裏が出る確率は等しい」という仮説(帰無仮説H0)を考える。」
さて、問題文「100 回投げて,表が61 回出た」を読んで、正しく「表の出る確率≠裏の出る確率」を立てることはできるのでしょうか。多くの生徒は、上のように「表の出る確率>裏の出る確率」と自然に考えるのではないかと、私には思えます。
では、どうすればよいか。私の考えはこうです。
主張したいことは「このコインには細工がされている」です。では、「細工がされていないとしたら、どうなるでしょう」をまず考えます。表も裏も同じような確率で出るだろうと考えられます。それを「数学的に記述する」と、「表の出る確率=裏の出る確率」となります。これが帰無仮説です。このとき、対立仮説も定まります。対立仮説は帰無仮説の否定ですから、「表の出る確率≠裏の出る確率」です。
帰無仮説についての面倒な話
違いはどこにあるのでしょう。
「解説」では、問題文「100 回投げて,表が61 回出た」を、「表の出る確率と裏の出る確率は等しくない」と記述していましたが、ここに飛躍があるのだと思います。問題文を素直に読み、書かれていることを数学的に記述すれば、単に「表の出る確率>裏の出る確率」になると思います。それをあえて「等しくない」と記述し直すには、もう一段階の思考が必要です。
そうではなく、「100 回投げて,表が61 回出た」ことから、コインが「細工されている」と主張したいわけですから、その主張の否定形をまず考えたほうが、すっきり帰無仮説にたどり着くのです。
帰無仮説の「帰無」は、聞きなれない表現です。「否定されることが前提だから」とか、「無に帰するために設定するから」、この名前があるのだ、などと説明されることが多いように思います。清水(2021)も同様のことを書いています。
しかし、私はこう考えます。「帰無仮説」は英語で「null hypothesis」といいます。無に帰する、否定する、と言う意味はそこにはなく、単に「null」な仮説、「無」な仮説です。これは「有意水準」の「有意=意味がある」に対して「無」だと考えたいと思います。すなわち、「無意味な」仮説です。
無意味と言っても、設定する価値がないとか、考えるに値しないという意味ではなく、あえて主張するに足りないというような意味です。コインの例で言うと、「表の出る確率と裏の出る確率は等しい」という「主張」は、あえて述べる価値のないことです。そんな当たり前のことを、人はわざわざ言いません。だから「null hypothesis」=「無意味な仮説」なのだと、私は思うのです。
そして、帰無仮説検定では、この帰無仮説の妥当性を検定します。
データを使って検定した結果、「帰無仮説が正しいとすると、100回のうち5回以下しか起こらないことが起こったことになるけど、ホントに帰無仮説が正しいでいいの?」という論理で、帰無仮説を棄却します。そして、「どうも、表の出る確率と裏の出る確率が等しい、ということは間違っているようですよ」と結論するわけです。
ただし、あくまでも有意水準を設定したうえで「棄却」しているにすぎません。帰無仮説が誤りだ、という強い主張をしているのではないのです。なぜかというと、有意水準の確率で(つまり5%の確率で)、仮説検定は間違えるからです。正真正銘、まったく偏りがないコインなのに、たまたま、何の因果か、100回中61回表が出てしまうことは、100回に1~2回くらいの確率で起こるからです。
最後に書いた「100回に1~2回くらい」の根拠を書いておきましょう。
偏りがないコイン(表が出る確率が2分の1)を100回投げて表が出る回数を確率変数Xとすると、Xの平均値と標準偏差は次のようになります。
$$
平均値(期待値)= np = 100 \times \frac12 = 50 \\
標準偏差 = \sqrt{np(1-p)} = \sqrt{ 100 \times \frac12 \times \frac12} = \sqrt{25} = 5
$$
確率変数Xの実現値61を、上記の平均値と標準偏差を使ってZ標準化すると、
$$
z = \frac{61-50}{5} = 2.2
$$
標準正規分布表によると、z>2.2の確率は0.0139です。つまり、偏りのないコインを100回投げたとき、表が61回以上出る確率は約1.4%ということになります。これが「100回に1~2回くらい」の根拠です。