見出し画像

[PSPP]t検定

2つの量的データについて、平均点を比較し差があるかどうかを確かめるのがt検定です。

t検定では、2つのデータに対応があるかどうか、2つのデータの母分散が等しいかどうかで手順が異なります。
母分散が等しい(F値が有意ではない)場合は、t統計量を求めて検定を行います。母分散が等しくない(F値が有意である)場合は、Welch(ウェルチ)の検定を行います。

ただし、検定を繰り返すほど有意になりやすくなるため、母分散の如何を問わず、Welchの検定で済ませればよいという意見もあり、オンライン統計ツール「statwing」では、t検定は標準でWelch(ウェルチ)の検定となっています。

対応のないt検定の実行

女子10名、男子10名の国語のテスト(10点満点)の結果は以下のようになったとします。女子と男子の平均点に差があると言えるかどうかを検定してみましょう。

データは「女子」が「0」、「男子」が1で変数「性別」に入力されています。変数「得点」は、得点の数値がそのまま入力されています。

・[分析]→[平均の比較]→[独立したサンプルのt検定]を選択。

・「検定変数」に「得点」、「グループ化変数」に「性別」を指定する。
・[グループの定義]をクリックし、「グループ1の値」に「女子」を、「グループ2の値」に「男子」を指定する(ここではラベルを設定しているので、ラベルで表示されている)。

・[続く]をクリックして、[独立したサンプルのt検定]に戻る。
・[OK]をクリック。

なお、グループは、「グループ1」と「グループ2」という2つしか指定できないだけで、そもそものグループ分けが2つである必要はありません。

例えば、成績順に上から「1」「2」「3」「4」の4つのグループに分けてあり、このうちの「1」と「4」という2つを比較するということはできます。ただし、4つのグループすべてを比較する場合は、後述の「分散分析」を用いる必要があります。

また、[グループの定義]に用いる変数が、テストの得点などの連続変数などの場合、「分割点」で指定することも可能です。この場合は、分割点の数値以上のグループと、分割点の数値未満のグループとの間で検定が行われます。

たとえば、指導前の何かの心理テストの上位者(7点以上)と下位者(7点未満)の間で、指導後の内容理解確認テスト結果に差があるかどうかを検定する場合は、「検定変数」に「指導後」、「グループ化変数」に「指導前」を指定し、[グループの定義]で、「分割点」に「7」を指定します。


出力の見方

「グループ統計」では、グループごとの人数(N)、平均、標準偏差、平均値の標準誤差が示されます。

次に、検定の結果が示されます。

まず、等分散性の検定結果を確認します。先にも述べたように、母分散が等しい(F値が有意ではない)場合は、t統計量を求めて検定を行い、母分散が等しくない(F値が有意である)場合は、Welch(ウェルチ)の検定を行います。

上段「等分散性を仮定する」がt統計量を求めた検定結果で、下段「等分散性を仮定しない」がWelch(ウェルチ)の検定の結果です。

この場合、F値(3.50)の有意水準(有意確率)は0.078で、0.05よりも大きいため有意ではなく、等分散性が仮定されるので、上段を見ます。

すると、自由度18、t値3.15で、有意水準(有意確率)0.006であり、1%水準で有意です。論文などへの記述としては、「t(18)=3.15,p<.01」とします。

もし、等分散性が仮定されない場合は、下段を見ます。

この場合は、自由度18、t値3.15で、有意水準(有意確率)0.007であり、1%水準で有意です。有意水準(有意確率)に殆ど差がないため、論文などへの記述としては、「t(18)=3.15,p<.01」となり、等分散性が仮定される場合と同じになります。


対応のあるt検定

ある大学の入学前教育プログラムの前後に英語のテストを行いました。受講者は15名で、その結果が次の表です。入学前教育プログラムの前後を比較して、成績が伸びている(プログラムに効果があった)と言えるでしょうか。

データは「事前」と「事後」の2変数に得点が入力されています。

・[分析]→[平均の比較]→[対応のあるサンプルのt検定]を選択。

・「事前」と「事後」を指定する。

・[OK]をクリック。


出力の見方

「対応のあるサンプルの統計」では、対応サンプルの平均、人数(N)、標準偏差、平均値の標準誤差が示されます。

次に、対応サンプルの人数(N)と相関係数、相関係数の有意水準(有意確率)が出力されます。この場合、相関係数は0.82と非常に高く、0.1%水準で有意であるので、非常に高い相関があると言えます。つまり、事前テストがよかったものほど事後テストも成績がよいということになります。

最後に検定結果が出力されます。自由度14、t値2.66(プラスであるかマイナスであるかにはあまり意味がないので、絶対値で記せばよい)、有意水準(有意確率)0.019で5%(0.05)未満ですから、5%水準で有意です。よって、事前と事後の結果には差があると言えます。論文などへの記述としては、「t(14)=2.66,p<.05」とします。


基準値と比較するt検定

2群の比較ではなく、ある基準値と群の平均値を比較する場合もt検定を行うことができます。

ここでは演習2で用いたt0.csvを使って、すでに分かっている学校全体の平均点を40点として、これとの比較を行います。

・[分析]→[平均の比較]→[1サンプルのt検定]を選択。

・[検定変数]に「得点」を指定、[検定値]に「40」と入力し、[OK]をクリック。

[オプション]では、有意水準の設定を行いますが、通常は95%で検定を行うので、特に変更する必要はありません。これは他の検定でも同様です。


出力の見方

この場合、「一標本統計」から、平均は40.41で、標準偏差が6.35、平均の標準誤差が0.66であることが分かります。

「一標本検定」から、自由度91、t=0.62、有意水準(有意確率)は0.534で、検定結果が統計的に有意ではないことが分かります。よって、このクラスの平均点が学校全体平均40点と異なっているとは言えません。

この記事が気に入ったらサポートをしてみませんか?