見出し画像

一元配置分散分析の公式と手順まとめ

一元配置分散分析(ANOVA)は、3つ以上の群の平均の間に統計学的に有意な差が存在するかどうかを判断するための統計手法です。この手法においては、分散のことを平均平方と呼びます。

以下の分散分析表を作成する手順をまとめます。

1元配置の分散分析表

1. 全平方和ST(合計)の計算

全体のデータとグループ全体の平均の差の平方の合計を求めます。

$${ST = \sum_{j=1}^{a}\sum_{i=1}^{n_j}(y_{ji} - \bar{y}..)^2}$$

  • データ集合の全値と全体平均との差の平方の和

  • ST = SA +Se

2.水準間平方和(SA)の計算

各水準(グループ)の平均が全体の平均からどのくらい偏っているかを表します。その計算は、各水準の平均と全体の平均との差の平方の合計になります。自由度は、水準数 - 1(全体の平均を算出するために使われる)です。

$${SA = \sum_{j=1}^{a}{n_j}(\bar{y_{j.}} - \bar{y}..)^2}$$

  • 水準全てが等しい母平均を持っているか?

  • 標本平均の分散を求め、母分散に戻すためにnjをかける

3.残差平方和(Se)の計算

各水準内での変動を表します。「各水準の平均」と「個別のデータの値」との差の平方の合計になります。自由度=データ数-水準数(水準数だけ平均値を使うため)

$${Se = \sum_{j=1}^{a}\sum_{i=1}^{n_j}({y_{ji}} - \bar{y}.)^2}$$

4. 平均平方和の計算

水準間平方和(SA)と残差平方和(Se)をそれぞれの自由度で割る
VA = SA / (a-1)
Ve = Se / (n-a)

5. F統計量の計算

水準間平均平方を残差平均平方で割る
F = VA / Ve

帰無仮説が正しい(全ての群間で平均値に違いがない)とき、F値は1前後になります。間違っている時(少なくとも一組の群間で平均値に有意な違いがある))F値は大きくなります。

その他

分散分析における係数の信頼区間の求め方

  1. グループ(水準)の標本平均(平均値の点推定量)$${\hat{\mu}_i}$$を求める

  2. $${\text{区間} = \hat{\mu}_i ± t{\alpha/2, \text{{df}}}\sqrt{\frac{V_e}{n_i}}}$$

    • t分布、自由度は残差のもの、Veは残差の平均平方和(分散)

    • niは水準のサンプル数を使用

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?