(4):尺度水準

統計科目の問題と言えばこれ、みたいな

この変数は何尺度か、みたいに、尺度水準を答える問題が、過去に3回出題されています。他の科目でも同様の問題が出されたことがあり、統計科目の問題としては定番の一つでしょう。
どの教科書でも、4つの「尺度水準」について説明されていますが、問題としてよく見るのは、数字で表されているけれども名義尺度あるいは順序尺度、というやつが多いように思います。郵便番号などが前者の例、商品レビューの星の数などが後者の例ですね。後者の場合、記号で代替しようと思えばできるので、少なくとも量的変数(間隔尺度、比例尺度)ではない、と考えることもできるでしょう。

説明する順序問題

ところで、「心理学統計法」は、この4つの尺度を、「比例→間隔→順序→名義」の順番で説明しています。以前に履修した教科書では、「名義→順序→間隔→比例」のような順で、あるいは、「質的変数(名義、順序)→量的変数」のような順で説明されることが多かったように記憶している(実際そうだった)ので、この説明順序は新鮮でした。

とはいえ、この順序は別の意味で理に適っています。なぜかというと、データ分析では、測定できるものなら、できるだけ量的変数で測定しておいた方が、あとあと便利だからです。
年齢を例にすると、最初から「20~30代、40~50代、60代以上」みたいに順序付けされたカテゴリ変数で調査してしまうと、たとえば「本当に20代と30代とでは差がないのか」のような問に答えられないからです。年齢を整数値で調査してあれば、(その方法の妥当性はおくとして)年齢を独立変数として回帰分析することも可能です。また、(やはりその方法の妥当性はおくとして)「50歳未満と50歳以上で従属変数の値を比較する」という分析も可能です。

つまり、量的変数(比例、間隔尺度)変数は、必要に応じて質的変数(順序、名義尺度)に「尺度水準を落とす」ことは可能ですが、その逆はできないわけです。

なので、可能であるなら、量的変数として調査したほうが都合がよい。そのことが、尺度水準の説明順序に表れているように思うのです。まあ、考え過ぎでしょうけどね。

テストの点数は何尺度か問題

私が最初に受講した「心理統計法」(心理「学」統計法ではなくて)では、「テストの点数は順序尺度です」ということが、わりと強調されていました。納得しますか?

私はそのとき、「0点は点数がない事を意味するんだから、当然、比例尺度でしょ? 100点は50点の2倍なんだから、比例尺度でいいでしょ?」と思っていました。同意しますか?

これ、「テストの点数が何を測っているか」に注目しないといけないのですね。数学のテストがあるとして、この数学のテストは何を測っているのでしょう。もし「数学の学力」を測っているのだとしたら、0点の人は、「数学の学力が全くない」という意味なのでしょうか。「授業の理解度」を測っているのだとしたら、0点の人は、「授業を何ひとつ理解していない」という意味なのでしょうか。

日常会話的には、そのような解釈もありそうです。テストの問題を難しくすれば、当然0点をとってしまう生徒は出るでしょう。しかし、その生徒に、数学の学力が全くないわけではなく、そのテストの問題に正しく答えられるほどの学力(理解度)はなかったが、問題に取り組むだけの学力(理解度)はあったのだと考えるのが自然でしょう。
というよりも、授業者の側は、授業の進め方に問題があった、問題の選択が難しすぎたと「反省」しなくてはなりません。

このように考えると、テストの点数は「間隔尺度」であるといえそうです。

めずらしく練習問題

私が以前使用していた教科書に、なかなかよい問題が示されていましたので、引用しておきます。4つとも理由付きで正しく答えられれば、尺度水準については完璧!(かな?)

以下のデータは,4つの尺度水準のうちのいずれであるか。
(a) スーパーマーケットで買った卵の重さを測定した。
(b) 企業の取引先を10種類に分類してA~Jの記号を割り当てた。
(c) テストの成績をA~Eの5段階で評価した。
(d) 成人の肥満度の段階を判定するため,(実体重-標準体重)÷標準体重 で表した。

放送大学教材「心理統計法 '11」(大澤・神宮)=すでに閉講している科目です