仮説検定の種類

を踏まえてまとめる

区分方法

・何を検定するか?
 ・代表値
  ・平均
  ・分散
  ・中央値
 ・割合
 ・度数
 ・相関
 
・前提条件は何か?
 ・パラメトリック/ノンパラメトリック
 ・正規分布
 ・等分散

・1群に対する検定か?2群か?3群以上か?
・対応があるかないか?
・検定量はどんな分布に従うか?


z検定

・母分散が既知の場合、z検定が使える
・母分散が未知の場合、t検定を使う

母平均(母分散既知)は特定の値と等しいのか?

2群(母分散既知)の母平均に有意差はあるのか?

母比率の検定

中心極限定理による

母比率の差の検定

t検定

母平均に関する検定
・標本平均の分散が大きいと、差があるとは主張しにくい
・サンプルサイズが小さいと、差があるとは主張しにくい
・3群以上の母平均の差を比較したい場合は、分散分析(ANOVA)を使う

・t検定は連続データに対する検定
・離散データに対しては、カイ2乗検定を使う(期待度数×観測度数の分割表を使う)

母平均(母分散未知)は特定の値と等しいのか?

2群(母分散未知)の母平均に有意差はあるのか?

・対応あり(2標本は1対)
・対応なし
 ・等分散を仮定できる場合:スチューデントt検定
 ・等分散を仮定できない場合:ウェルチt検定

※等分散かどうかを判定するにはF検定を使う(P値が0.05以下なら分散に有意差がある)
※両側検定:差があるかどうかを知りたい
※片側検定:大小関係があることを知りたい

χ2検定

・χ2検定は、離散データに対する検定(期待度数×観測度数の分割表を使う)
・ピアソンのχ2検定(独立性検定、適合度検定)

独立性検定:2つの変数は独立しているのか?

・期待度数は帰無仮説「独立している」に基づき計算する
・分割表は、変数Aの取り得る値数×変数Bの取り得る値数
・データ数が少ない時は、χ2分布に近似できないので、フィッシャー正確確率検定を使う
・実務的には、A/Bテストツールを使うことも多い

適合度検定:期待度数と観測度数のズレは偶然か?

・期待度数は帰無仮説に基づいて計算する
・分割表は、変数の取り得る値数×2(期待度数と観測度数)

母分散は特定の値と等しいのか?(1標本)

F検定

2群の母分散に有意差はあるのか?

・2群が正規分布に従うことが前提条件
・母分散比を統計量に使うため、「母分散の比の検定」とも呼ばれる


WMW検定

2群の母中央値に有意差はあるのか?

・WMW検定は観測値の順位のみに着目しているため、母集団がどんな確率分布(双峰な分布、歪んだ分布など)に従っていても使えるノンパラメトリック統計の代表格である

分散分析(ANOVA)

・対応のある(paired, repeated)/対応のない
・繰り返しのある(replication)/繰り返しのない
・N元配置法:比較の切り口の数がN個(職種別、役職別、など)
※対応のある1元配置法=繰り返しのない2元配置法

分析手法のフローチャート

3群以上の母平均に有意差はあるのか?

一元配置分散分析


この記事が気に入ったらサポートをしてみませんか?