(3):「期待度数」には何も「期待」してはいけない。

「期待」度数とは「何も期待していない」度数のこと

期待度数

統計用語の中には「期待」という言葉がときどき登場しますね。「ときどき」といっても、実際には「期待値」「期待度数」くらいなのですが、どっちもけっこう理解しにくい概念なのだろうと思います。
ここでは「期待度数」について書きます。
「期待度数」とは、「何も期待していない」度数です。
ん?どういうこと?

「期待」

国語辞典を見てみましょう。「期待」の語義としてこんなことが書いてあります。

きたい【期待】
(a) 将来その事が実現すればいいと、当てにして待ち設けること
(b) 望ましい事態の実現、好機の到来を心から待つこと

(a) 広辞苑第六版(b)新明解国語辞典第七版

ところが、「期待値」となるとまるで違います。(新明解には見出し語なし)

期待値【期待値】離散的確率変数のとる値に、対応する確率をそれぞれ掛けて加えた値。平均値。

広辞苑第六版

ほらね。「はあ?」って感じでしょ。「期待値」は、その計算手順を解説しているだけで、それがどのような意味なのかは解説されていません。「期待値」を理解するのに、「期待」という語の通常の意味なんぞ参考にしてはいけませんぞ!と宣言しているようです。なお、残念ながら「期待度数」は、手元の辞書には見出し語がありませんでした。

期待度数の計算方法

では、期待度数の意味について書いてみようと思うのですが、そのためには、その計算方法と、計算結果が示す意味について確かめておく必要があります。まず計算方法です。おなじみの仮想データを用います。

出身地とラーメンの味の好み(仮想データ)

このクロス表の期待度数は次のようになります。自力で計算できますか?

期待度数の表

赤字で示した「20」について計算式を示すと、$${50\times 40\div100=20}$$ となります。赤字で示した「20」は、表側、表頭の言葉を用いると、「”関東”の”しょうゆ”は20人」となりますから、期待度数を求める式では、「”関東”の合計(50)×”しょうゆ”の合計(40)÷総度数(100)」と計算します。
へえ、そうなの。という感じですよね。よくわからんけど、試験のために覚えとくわ。みたいな。

相対度数にしてみる

では、上の表を相対度数表にしてみましょう。すると、もう少し意味が分かってくるかもしれません。ここでは行相対度数だけを扱いますが、列相対度数で考えても同じ結果になります。

観測値の相対度数/期待度数の相対度数

さきほどの表たちとよーく見比べてくださいね。そうすると、期待度数というのがどういう意味をもっているのかが、ぼんやりと見えてくると思うのです。つまり、

合計の行を見ると「しょうゆ対とんこつ」は「0.4:0.6」
1行目の関東だけ見ても「0.4:0.6」
2行目の九州だけ見ても「0.4:0.6」
え! 期待度数って、「行相対度数がどの行でも同じになるように計算した度数」ということなの?

そういうことです。

なあんだ。ってことはさあ、これがもし観測値だったとしたらさ、何か意味ありげに「関東」と「九州」と分けてみたけど、なーんか、ぜんぜん、まったく、1ミリも、「分けてみる意味なかったじゃ~~~ん!」ってなるね。

そういうことです。それが期待度数です。

そうか、「何も期待しない度数」って、そういうことね。じゃあ、なんでそんなもの、わざわざ計算するの?

期待度数を計算する理由

さきほどの計算からわかるように、期待度数では、「行相対度数がどの行でも同じ」というところに意味があります。

せっかく「関東」と「九州」に分けたからには、関東と九州とでは好みが違うんだろうなあ、という予想があったはずなのですね。だから分けてみた。で、実際に分けて見たら、最初の表のように、度数に偏りが出た。「やっぱり!」となります。で、カイ二乗検定をして、「ほらね、統計的にも差があるよ!地域で好みが違うのよ!」とか言いたいわけです。

だったら、なぜわざわざ「期待度数」を計算するかというと、「度数に偏りがある」とか言うけれど、何を基準にして「偏りが」と言っているのかを明示しないといけませんよね。その基準になるのが「期待度数」です。
「あなた、度数に偏りが出そうとか言っているけど、これ(期待度数)と比べて、どれくらい偏っているのか、ちゃんと検定しなさいよね!」と言われているのですね。なので、「度数に偏りがある」という予想ともっとも遠い状態、すなわち、「まったくもって、ほんの少しも、わずか1ミリも、度数が偏っていない状態」を期待度数として考えるのです。

期待度数は帰無仮説

別の教科書になりますが、「心理学統計法」では、「帰無仮説」を次のように説明しています。

統計的検定の論理では、まず「母数についての等号の仮説」を立て、それをデータによって偽であることを示す、という背理法に似た方法を使います。(中略)「母数の等号についての仮説」は、背理法によって偽であることを示されることが期待されています。そのことから、この仮説のことを帰無仮説(null hypothesis)と言います。

清水 (2021)「心理学統計法」放送大学教育振興会、第12章

この説明にしたがうと、クロス表の検定では、母集団においては、クロス表のどの行についても、「行相対度数の構成比が等しい」という「等号についての仮説」(=帰無仮説)を立てます。それを、カイ二乗検定で検定し、この仮説が偽であることを示そうとするわけです。期待度数は、クロス表についての帰無仮説を、具体的に数値で示したものだといえます。

いやあ、今回はちょっとばかり、チカラが入っちゃいましたね。もうちょっと別の語り方もできるんだけど、それはまあ、別の機会に。