一元配置分散分析の公式と手順まとめ

2023年11月16日 16:51

一元配置分散分析(ANOVA)は、3つ以上の群の平均の間に統計学的に有意な差が存在するかどうかを判断するための統計手法です。この手法においては、分散のことを平均平方と呼びます。

以下の分散分析表を作成する手順をまとめます。

1. 全平方和ST（合計）の計算

全体のデータとグループ全体の平均の差の平方の合計を求めます。

$${ST = \sum_{j=1}^{a}\sum_{i=1}^{n_j}(y_{ji} - \bar{y}..)^2}$$

各水準（グループ）の平均が全体の平均からどのくらい偏っているかを表します。その計算は、各水準の平均と全体の平均との差の平方の合計になります。自由度は、水準数 - 1（全体の平均を算出するために使われる）です。

$${SA = \sum_{j=1}^{a}{n_j}(\bar{y_{j.}} - \bar{y}..)^2}$$

各水準内での変動を表します。「各水準の平均」と「個別のデータの値」との差の平方の合計になります。自由度＝データ数-水準数（水準数だけ平均値を使うため）

$${Se = \sum_{j=1}^{a}\sum_{i=1}^{n_j}({y_{ji}} - \bar{y}.)^2}$$

水準間平方和（SA）と残差平方和（Se）をそれぞれの自由度で割る
VA = SA / (a-1)
Ve = Se / (n-a)

水準間平均平方を残差平均平方で割る
F = VA / Ve

帰無仮説が正しい（全ての群間で平均値に違いがない）とき、F値は１前後になります。間違っている時（少なくとも一組の群間で平均値に有意な違いがある））F値は大きくなります。

グループ（水準）の標本平均（平均値の点推定量）$${\hat{\mu}_i}$$を求める
$${\text{区間} = \hat{\mu}_i ± t{\alpha/2, \text{{df}}}\sqrt{\frac{V_e}{n_i}}}$$
- t分布、自由度は残差のもの、Veは残差の平均平方和（分散）
- niは水準のサンプル数を使用

#勉強記録

12,166件

この記事が気に入ったらサポートをしてみませんか？