見出し画像

確率変数と実現値

この記事では、「確率・統計」を学ぶ上で欠かせないワードの一つ「確率変数」について話していきます。本ワードは、資格試験合格に直結したり実用上の何かに役立つかというと、そんなに役に立たないかと思います。しかし、「統計学」を学んでいく中で皆さんに混乱が生じやすいポイントがここには詰まっています。基本がまだ疎かだと思う方や基本に立ちかえりたい方は、ぜひ御一読いただければと思います。

統計学の教科書などでよく見る「X(大文字)」,「x(小文字)」について気にした・気になった方は一定数いるかと思います。特に読んでいても違和感はなく同じものとみなして読み進める方も多いでしょう。しかし、これを同一視してしまうと、後々大変なことになってしまいます。

結論から言うと、この2つには意味的に大きな違いがあり、それは大文字が「確率変数」、小文字が「実現値」を表しているというところです。

例を取って考えてみましょう。例えば、A君が六面サイコロを投げるという事象を考えます。サイコロには、「1,2,3,4,5,6」の目が書いてあります。また、各面が出る確率は一様で1/6とします。このとき、教科書なんかでは

P(X=x)=1/6 (x=1,2,3,4,5,6)

と書かれるはずです。何ら不自然なことはありませんね。では、前段落の最後に言った違いと照らし合わせながら見てみましょう。今回の例では、「確率変数X」の「実現値」の候補は1,2,3,4,5,6です。ここから何かわかった方もいるでしょうか。

確率変数とはその名の通り、「確率的に変動する値」のことで、「これ!」と決まった値は事象が生じる前に取り得ることはありません。つまり、A君がサイコロを投げるという事象が行われる前は「実現値」がないわけなので、「確率変数」は定まりません。では、A君がサイコロを投げて1の目が出たとしましょう。この場合、「実現値」は1で「確率変数」がついに「実現値」という定まった値を持ったような形になります(ここは濁してあります。後述参照)。そして、1の目が出る確率は1/6なので、

P(X=1)=1/6

と書けます。

この例から分かるように、確率変数(大文字)は、事象が生じる前では確率的に変化する変数、実現値(小文字)は事象が生じた後に決まる定数でそれと同時に実現値によって定まる「範囲」で確率変数が動く、といった解釈で良いと思います。「範囲」と書いたり「動く」と表現したのは、連続型確率変数のことも考慮したためです。離散型だと確率は「X=x=1」という形になり「X=1の範囲を動く」と表現できますが、連続型だと実現値が定まると確率は「X≦x」の形で表せます。少なくとも私はこの解釈で不都合が起こったりすることはありませんでした。要は、文字が定まるタイミングが異なる、ということですね。

余談ですが、ある統計量はT(X)と、統計量の実現値はt(x)と表すことが一般的です。統計検定でも「最尤推定量」を求めよなのか、「最尤推定値」を求めよなのかで話は違いますね。前者は大文字で、後者は小文字での表記が望ましいです。

今回の話が簡単だと思われた方も難しいと思われた方もいらっしゃるかと思います。また、私は数学者などではないのでこれ以上の厳密な定義の違いとかまではわかっていません(汗)。悪しからずご了承ください。もし、こんな理解の仕方もある、などがあればコメント欄にてお願いします。ここまで読んでいただきありがとうございました。

この記事が気に入ったらサポートをしてみませんか?