(7)：平均値の差の検定

Almond Fish (Motofumi Kozakai)

2023年10月19日 11:49

帰無仮説の表現を確かめよう

検定のときに最初に設定するのは帰無仮説の方ですね。クロス表の検定のところで、期待度数というのは何も期待しないこと（＝帰無仮説）で、検定というのは帰無仮説の世界でやっている、ということを書きました。平均値の差の検定でも同じです。

平均値の差の検定では、期待度数は登場しませんが、「何も期待しない」という点は同じです。ふつう、平均値の差の検定をするときには、「こっちのほうが高いって出てほしいなあ」という淡い希望をもつものです。

新しい指導法の方が効果があってほしいなあ。
新しい肥料の方が生育がいいといいなあ。
自己肯定感の高いグループの方がパフォーマンスがいいはずだよなあ。などなど。

しかーし。

帰無仮説は、こうした希望を、まったく、ぜんぜん、1ミリも期待しないように書くのです。つまり、

「新しい指導法試したって？　前と変わらないに決まってんじゃん」
「新しい肥料？　前と同じに決まってんじゃん」
「自己肯定感が高い方が？　同じに決まってんじゃん」

みたいな。あんまり仲良くしたくないタイプの人ですね。
もう少し格調高く書くと、「等号の仮説」です。つまり、

新しい指導法での成績＝これまでの指導法の成績
新しい肥料での収穫量＝古い肥料での収穫量
自己肯定感が高いグループのパフォーマンス得点＝自己肯定感が低いグループのパフォーマンス得点

みたいな感じです。

はじめから差がある世界ではダメなのか

こういうのを読んでくると、はじめから「新しい指導法の方が成績がいい」という仮説を直接検証すればいいじゃん？　みたいに考えたくなります。が、これ、ダメなんですね。できません。なぜって？

「成績がいい」というのは、具体的に「何点」差があればいいのでしょう？　3点？　5点？　でもそれって、テストが何点満点かによりますよね。50点満点で5点差と、600点満点で5点差では意味が違う。

仮に、もしも、「じゃあ100点満点で7点差で！」で合意したとしても、です。実際にテストを実施してみたら、差は6.5点だった！　とか、どうしますか？　たった0.5点なら「差があった」でいいんじゃね？　としますか？　6.3点ならどうしますか？

という、まあ、あまり関わりたくないような議論が起きてしまうことは間違いないでしょう。結局、程度問題だということになってしまいます。なので、最も単純な「差が無い＝帰無仮説」の世界で検定をして、「どの程度帰無仮説の世界で目立っちゃってるのか」、その目立っちゃってる程度を評価しましょ。という考えに行き着くのです。

たぶんだけどね。

帰無仮説の世界を表すt分布

平均値の差の検定では、2つのグループの「差」（テスト得点の差とか、収穫量の差とか、パフォーマンス評価の差とか、ですね）が、自由度$${n-2}$$のt分布に従うことを利用するのが一般的です。

帰無仮説は、「差が無い（差＝０）」ですので、この分布は０を中心にした左右対称の山の形をしています。（教科書でt分布の形をみてくださいね。正規分布にひじょーによくにた、ベルの形をしています。）
で、希望がかなって差が大きいほど、帰無仮説の世界では「目立つ」ので、目立ち方が限界値を超えた時に、目立つ！　有意差がある！　母集団でも差がある！　と、いちおう主張できることになります。
（いちおう、と書いたのは、有意水準＝通常5％くらいは、「あ、間違ってましたね。残念！」となる可能性があるからです）

いちおう補足すると、差が大きいほど「目立つ」というのは、差が大きいほど、分布の山型の端っこのほうに行く、ということですね。端っこの方は、そもそも出現確率が低い（めったにお目にかからない）ので、出てくるととっても目立つのです。
このあたり、確率が小さい方が情報量が大きいのだ、という情報量の理論を思い出しますね（正確に知らないから、思い切りざっくりしてますが）。

今回は以上！　ご検討をお祈り申し上げます。