(9):有意=少なくとも相関係数は0じゃないらしい。だから?

相関係数の有意性検定

よくある間違いとして、入門書に書いてありそうなやつは、「相関係数が有意だから、強い相関がある!」ってやつですね。これは誤り。だって、有意になったと言うことは(ごく普通の、いわゆる「無相関検定」の場合)、「少なくとも相関係数が0だとは言えないよね」くらいの結論しか示していないわけで、「強い相関」なんて一言も言ってくれない。

あと、サンプルサイズが大きくなれば、$${r=0.15}$$みたいな小さい係数でも有意になりますからね。$${r=0.15}$$って、散布図を描いてみると、「はあ?」って感じです。「どこが有意なん?」としか見えません。でも、自分の仮説が正しいことをなんとか証明したーい!とか思っていると、つい「計数小さいけど有意だもんね!ばんざい!」というメンタルに陥ってしまうのですね。気をつけよう。

この問題必要か?

前置きはこれくらいにして、過去問を見て見るんだけど、この問題必要か?と思ったりします。なぜ?

まず、この問題を解くには、相関係数とサンプルサイズから、検定統計量(t値)を計算する必要があります。その計算式は、12章にあって、次の式ですね。

$$
t=\frac{r}{\sqrt{1-r^2}}\sqrt{n-2}
$$

数値を代入すれば計算は簡単。しかも、とっても計算しやすい(ほとんど暗算できる)ような数値を選んでくれているので、計算も楽ちん。

で、次は何をするかというと、計算された検定統計量と、該当する分布表に示された臨界値を見比べて、結論を下すのですが。

この教科書には分布表が添付されていない

統計学の入門書には、大抵の場合、標準正規分布表、t分布表、カイ二乗分布表、F分布表が(簡略なものであるにしろ)付録として収録されていることが多いのです。が、「心理学統計法」には、これらが全く収録されていません。これは、著者の方針なのだろうと思われます。

「まえがき」によると、統計的検定だけでなく区間推定を行うことが推奨されている、と書かれています。その上で、区間推定の計算は難しいのでソフトウェアにまかせ、教科書ではその原理や考え方を丁寧に解説する、としています。統計的検定については詳しく触れられていませんが、上記のような方針にしたがうなら、統計的検定の考え方やその限界について丁寧に解説し、計算や検定結果についてはソフトウェアにまかせる、という方針なのではないかと「推測」するわけです。

過去問に戻ると、先に示した計算式で検定統計量を計算すれば、正しい選択肢を選ぶことができます。計算した検定統計量が臨界値を超えているのかどうか、それをどう解釈するか、については問わないまま、正しい選択肢を選ぶことができてしまいます。だから、これでいいの? と思うのです。これでは計算問題と同じじゃないの? と。

検定結果の意味を問うてほしい

だから、他の多くの教科書(典型的には「社会統計学入門」)がしているように、検定統計量と臨界値を示したうえで、その(より望ましい)解釈を選ぶ、というような問題にしたほうが、学習者のためなのではないかなあ、と思うのです。実際に「社会統計学入門」がどういう問題文や選択肢を採用しているかは、ご自身で確かめてください。いずれこの「過去問雑談」でも取り上げようと思っています。