見出し画像

[PSPP]分散分析(ANOVA)①

2つの平均値を比較する場合はt検定を用いましたが、3つ以上の平均値を比較する場合は分散分析(analysis of variance略してANOVA)を用います。

たとえば、生徒の学習形態(一斉指導、eラーニング、アクティブラーニング)の違いが課題の理解に影響するかどうかを調べたいとしましょう。すると、生徒をランダムに3群に分け、課題終了後にテストを実施して得点を比較することになります。

こうした場合、ひとつの方法として、この問題を3つに分けて考える手法があります。

①一斉指導・eラーニング間の得点の相違
②eラーニング・アクティブラーニング間の得点の相違
③一斉指導・アクティブラーニング間の得点の相違

これら3つについて検定を行うわけですが、単純にt 検定を繰り返すのは統計学的には誤りです。それは、「有意差がないにもかかわらす有意差があるとしてしまう誤り」つまり「第一種の過誤」の確率が増加してしまうためです。

たとえば、上の①から③についてt検定を行ったとします。すると、5%水準で検定を行った場合、それぞれ有意でない確率は1-0.05=0.95ですから、3つの学習形態のいずれも有意差のない確率は0.95×3=0.86となります。よって「第一種の過誤」を冒す危険率は1-0.86=0.14となり、本来の5%よりも増加してしまいます。そこで、

○3種類の学習形態間に得点の相違があるか

という1つの問題だけについて検定を行えば、全体として5%の危険率を保つことができます。これを可能にするのが分散分析です。

ただし、分散分析だけでは、「3種類の学習形態間に得点の相違がある」ということは分かっても、どれとどれの間に相違があるのかはわかりません。そこで、全体としての相違を検定した後に、どれとどれに違いがあるかを多重比較によって検定します。この場合、分散分析を上位検定、多重比較を下位検定と呼びます。
なお、多重比較の方法には「テューキー(Tukey)の多重比較検定」や「ボンフェローニ(Bonferroni)の補正」などがあります。

変数と要因

分散分析では、独立変数と従属変数を設定します。独立変数は要因ともいい、比較する条件に相当します。上の例の場合には学習形態が該当します。従属変数は独立変数の影響を受ける変数で、上の例の場合にはテストの得点が該当します。
独立変数が1つの場合には1要因、2つの場合には2要因と表現します。また、独立変数(要因)に含まれるカテゴリを水準といい、カテゴリが2つの場合には2水準、3つの場合には3水準と表現します。この2つを組み合わせて「○要因○水準の分散分析」という表現をするので、上の例の場合には「1
要因3水準の分散分析」ということになります。

水準の設定の仕方によって、要因は2種類に分けることができます。

①対応あり要因(被験者内要因):事前テストと事後テストのように、それぞれの水準に同じ被験者が
割り当てられている場合。その要因で構成された計画を被験者内計画という。
②対応なし要因(被験者間要因):学習形態に被験者をランダムに振り分けたように、それぞれの水準ごとに異なる被験者が割り当てられている場合。その要因で構成された計画を被験者間計画という。

なお、2要因以上で、両者の要因が混在している場合を混合計画といいます。


対応のない1要因分散分析(被験者間計画)

冒頭で取り上げた学習形態別の課題終了後テストの得点データが、次のように得られたとします。


これを元に、学習形態によって平均点が異なるかどうかを検定しましょう。

・「学習形態」という変数に、「一斉授業」を「1」、「eラーニング」を「2」、「アクティブラーニング」を「3」としてデータを入力し、「変数ビュー」の[変数ラベル]を設定。
・「得点」という変数に得点を入力。

・[分析]→[平均の比較]→[一元配置分散分析]を選択。

・[従属変数リスト]に「得点」、[因子]に「学習形態」を指定する。
・[統計]の[記述統計量][等分散性の検定]にチェックをつけておく

SPSSでは[その後の検定]をクリックし、[Tukey]にチェックを入れ、[続行]をクリックすることで、多重比較を行うことができますが、PSPPでは、GUIからは多重比較が行えないので、[貼り付け]をクリックし、「シンタックスエディタ」を起動する必要があります。
「シンタックスエディタ」起動すると、次のように表示されます。

ONEWAY /VARIABLES= 得点 BY 学習形態
 /STATISTICS=DESCRIPTIVES HOMOGENEITY .

この2行目の最後の「.(ピリオド)」をとり、3行目に、

/POSTHOC=TUKEY.

と追加します。

[実行]→[すべて]を選択する。

TUKEY以外に、BONFERRONI、GH(Games-Howell法)、LSD(最小有意差)、SCHEFFE、SIDAKが指定できます。GHは等分散が仮定できない場合、その他は等分散が仮定できる場合に用います。


出力の見方

「記述統計量」には、グループごとの人数、平均、標準偏差などが示されています。

「分散の等質性検定」は、t検定の場合と同じで、左からF値、分子の自由度df1(水準数-1)、分母の自由度df2(サンプルサイズ-水準数)、有意水準(有意確率)となっていて、ここでは、p>.05で等分散と言えます。

「分散分析」は、全体として差があると言えるかどうかを検定した結果です。自由度(2,18)、F値が1.47、有意水準(有意確率)pは0.257で、0.05よりも大きいので有意ではありません。よって、3つの学習形態で課題理解に差があるとは言えない、となります。報告する際は、F(2.18)=1.47,n.s.と表記します(n.s.はnot significantの略)。

「多重比較」では、Tukey法(TukeyのHSD法)による結果が記されています。ここでは大きく3段に分かれています。(I)について(J)のそれぞれと比較ということで、3水準あるので(I)が3段になっています。しかし、全ての組み合わせを行っているため、例えば「一斉授業」と「eラーニング」、「eラーニング」と「一斉授業」は比較としては同じなので、どちらか一方を見れば大丈夫です。

この場合、有意水準(有意確率)pはいずれも0.05より多く有意ではないので、どのグループ間においても得点に差はないと言えます。


この記事が気に入ったらサポートをしてみませんか?