見出し画像

統計的な推測~いよいよ仮説検定だ!

Cover Photo by Christopher Burns on Unsplash

統計的仮説検定(帰無仮説検定)

「解説」に掲げられている、指導要領の内容について、一部を再掲します。

 ア 次のような知識及び技能を身に付けること。
  (ア)標本調査の考え方について理解を深めること。
  (イ)確率変数と確率分布について理解すること。
  (ウ)二項分布と正規分布の性質や特徴について理解すること。
  (エ)正規分布を用いた区間推定及び仮説検定の方法を理解すること。

「解説」より

前回までに、確率変数と確率分布について、二項分布と正規分布について書いてきました。残るは、区間推定と仮説検定です。今回は仮説検定について書いておきます。
統計的仮説検定、あるいは帰無仮説検定、というのが正しい(?)名称です。名称からわかる通り、鍵を握るのは「帰無仮説」の設定です。帰無仮説が妥当であるかどうかを検定するのでこの名前があると理解しています。

仮説検定の手順

「解説」では、「一般に,仮説検定は次のような手順で行われる」として、次の手順を示しています。

1)ある事象Eが起こった状況や原因を推測し,仮説を立てる。
2)その仮説を数学的に記述することで,統計的に実証したい仮説H1(対立仮説)を立て,その否定命題としての帰無仮説H0を考える。
3)帰無仮説H0が真であると仮定した場合に事象Eが起こる確率pを求める。
4)実験などを行う前に決めておいた「滅多に起こらないと判断する基準(確率の値)」(有意水準)とpとを比較して,帰無仮説H0が真であると考えることを否定できるかどうかを判断し,仮説の妥当性を判断する。

「解説」p.108-109

この説明には、少々ひっかかりがあります。次の部分です。「統計的に実証したい仮説H1(対立仮説)を立て,その否定命題としての帰無仮説H0を考える」。
私がもっとも信頼する教科書「心理学統計法’21」(清水, 2021)には、こう書いてあります。

統計的検定の論理では、まず「母数についての等号の仮説」を立て、それをデータによって偽であることを示す、という背理法に似た方法を使います。(中略)この仮説のことを帰無仮説(null hypothesis)と言います。帰無仮説は$${H_0}$$という記号を使います。たとえば、$${H_0:\mu=100}$$と表記します。(中略)続いて、帰無仮説の否定として立てられる仮説のことを対立仮説(alternative hypothesis)と呼びます。対立仮説は$${H_1}$$という記号を用いて、$${H_1:\mu\ne100}$$と、必ず帰無仮説の否定で表されます。

「心理学統計法」p.185-186。ただし、脚注番号と脚注は省略し、一部の改段も省略した。

違いが伝わったでしょうか。次の部分です。「対立仮説は(中略)必ず帰無仮説の否定で表されます。」

お互いに相手の否定形で表されるのだから、どっちだって同じことを言っているだろう、とも考えられます。でも、ちょっとまってください。これは書き方の問題ではなく、仮説を設定するときの考え方の問題です。「解説」に掲げられている次の例題をもとに考えましょう。

例題:このコインには偏りがないか

例題はこうです。

あるコインにはどちらかの面が出やすくなるよう細工がされているという噂がある。そこで,実際にそのコインを投げる実験を行ったところ,100 回投げて,表が61 回出た。このとき,このコインには細工がされていると主張してよいだろうか。

「解説」p.109

この例題で、帰無仮説、対立仮説はどうなるのでしょうか。「解説」で解説されているとおりに考えると、まず「表の出る確率>裏の出る確率」が対立仮説となるように思えます。するとその否定は、「表の出る確率≦裏の出る確率」となります。
ですが、「解説」にはそうは書いてありません。「統計的に実証したい仮説「表の出る確率と裏の出る確率は等しくない」(対立仮説H1)を立て,その否定命題である「表と裏が出る確率は等しい」という仮説(帰無仮説H0)を考える。」
さて、問題文「100 回投げて,表が61 回出た」を読んで、正しく「表の出る確率≠裏の出る確率」を立てることはできるのでしょうか。多くの生徒は、上のように「表の出る確率>裏の出る確率」と自然に考えるのではないかと、私には思えます。

では、どうすればよいか。私の考えはこうです。
主張したいことは「このコインには細工がされている」です。では、「細工がされていないとしたら、どうなるでしょう」をまず考えます。表も裏も同じような確率で出るだろうと考えられます。それを「数学的に記述する」と、「表の出る確率=裏の出る確率」となります。これが帰無仮説です。このとき、対立仮説も定まります。対立仮説は帰無仮説の否定ですから、「表の出る確率≠裏の出る確率」です。

帰無仮説についての面倒な話

違いはどこにあるのでしょう。

「解説」では、問題文「100 回投げて,表が61 回出た」を、「表の出る確率と裏の出る確率は等しくない」と記述していましたが、ここに飛躍があるのだと思います。問題文を素直に読み、書かれていることを数学的に記述すれば、単に「表の出る確率>裏の出る確率」になると思います。それをあえて「等しくない」と記述し直すには、もう一段階の思考が必要です。
そうではなく、「100 回投げて,表が61 回出た」ことから、コインが「細工されている」と主張したいわけですから、その主張の否定形をまず考えたほうが、すっきり帰無仮説にたどり着くのです。

帰無仮説の「帰無」は、聞きなれない表現です。「否定されることが前提だから」とか、「無に帰するために設定するから」、この名前があるのだ、などと説明されることが多いように思います。清水(2021)も同様のことを書いています。

しかし、私はこう考えます。「帰無仮説」は英語で「null hypothesis」といいます。無に帰する、否定する、と言う意味はそこにはなく、単に「null」な仮説、「無」な仮説です。これは「有意水準」の「有意=意味がある」に対して「無」だと考えたいと思います。すなわち、「無意味な」仮説です。
無意味と言っても、設定する価値がないとか、考えるに値しないという意味ではなく、あえて主張するに足りないというような意味です。コインの例で言うと、「表の出る確率と裏の出る確率は等しい」という「主張」は、あえて述べる価値のないことです。そんな当たり前のことを、人はわざわざ言いません。だから「null hypothesis」=「無意味な仮説」なのだと、私は思うのです。

そして、帰無仮説検定では、この帰無仮説の妥当性を検定します。
データを使って検定した結果、「帰無仮説が正しいとすると、100回のうち5回以下しか起こらないことが起こったことになるけど、ホントに帰無仮説が正しいでいいの?」という論理で、帰無仮説を棄却します。そして、「どうも、表の出る確率と裏の出る確率が等しい、ということは間違っているようですよ」と結論するわけです。
ただし、あくまでも有意水準を設定したうえで「棄却」しているにすぎません。帰無仮説が誤りだ、という強い主張をしているのではないのです。なぜかというと、有意水準の確率で(つまり5%の確率で)、仮説検定は間違えるからです。正真正銘、まったく偏りがないコインなのに、たまたま、何の因果か、100回中61回表が出てしまうことは、100回に1~2回くらいの確率で起こるからです。

最後に書いた「100回に1~2回くらい」の根拠を書いておきましょう。
偏りがないコイン(表が出る確率が2分の1)を100回投げて表が出る回数を確率変数Xとすると、Xの平均値と標準偏差は次のようになります。

$$
平均値(期待値)= np = 100 \times \frac12 = 50 \\
標準偏差 = \sqrt{np(1-p)} = \sqrt{ 100 \times \frac12 \times \frac12} = \sqrt{25} = 5
$$

確率変数Xの実現値61を、上記の平均値と標準偏差を使ってZ標準化すると、

$$
z = \frac{61-50}{5} = 2.2
$$

標準正規分布表によると、z>2.2の確率は0.0139です。つまり、偏りのないコインを100回投げたとき、表が61回以上出る確率は約1.4%ということになります。これが「100回に1~2回くらい」の根拠です。