t検定の検定統計量(丸暗記なし)
検定統計量は差を標準化しているだけ
私が最初に統計学を学び始めたとき検定統計量
ウゲって思ったことを思い出した
この式を覚えなきゃいけないなんて
なんてめんどくさいんだ
統計学なんて暗記ゲーやん
$$
t = \frac{\bar{x} - \mu}{\sqrt{\frac{s^2}{n}}}
$$
でもこの$${t}$$値をよくよく見てみると
分子が平均との差
分母が標準偏差になっていることがわかる
つまりこれは持っているデータたちを
平均$${0}$$
分散$${1}$$
に変換する標準化をしているだけである
(標準化について具体例は下記)
https://bellcurve.jp/statistics/course/19647.html
標準化で検定統計量を出す意味
なんでわざわざ検定統計量を出すのかというと
比較したいものとどれだけ差があるかを標準化して
公平に見るためである
例えば帰無仮説を
「50m走のタイムは7秒である」
「ハンドボール投げのスコアは30mである」
の2種類を確かめるとする
今持っている標本100名の平均について
「50m走の標本平均タイムは8秒である」
「ハンドボール投げの標本平均スコアは40mである」
と分かっているとする
単純に帰無仮説との差を取ると
50m走に関しては「1」秒の差
ハンドボール投げに関しては「10」mの差
になるのでハンドボールの帰無仮説の方が棄却されやすい
と決めていいのだろうか?
言い換えれば
ハンドボール投げの10mの違いと
50m走の10秒の違いは同じだろうか?
いや違うことは明白だろう
ということで差を同じ尺度見る必要があるので
平均を0分散を1に変換する標準化をしているのである
検定統計量の具体例
岐阜県のデータによると高校生の
50mの標準偏差は0.5くらいなので
t値は計算すると20になる
$$
t = \frac{8-7}{\frac{0.5}{10}}
= 20
$$
一方ボール投げ標準偏差は6.0くらいなので
t値を計算すると16.6になる
$$
t = \frac{40-30}{\frac{6.0}{10}}
= 16.6
$$
これで50m走とハンドボール投げの帰無仮説との差が
先ほどよりも小さくなり
帰無仮説が棄却されやすく変化した
他の検定統計量のざっくりイメージだけ知りたい場合は下記を参照
この記事が気に入ったらサポートをしてみませんか?