G検定 / 統計検定 確率分布 #1

株式会社リュディアです。今回から確率分布についてまとめていきます。

初回は確率分布自体についての説明です。確率分布という言葉は何となく使っていても問題になりづらい用語の1つだと思います。丁寧に見ていきましょう。

まず確率変数という用語から始めます。例えばサイコロの出目を扱う場合、サイコロの出目は確率変数です。コイントスを扱う場合、コインの表、コインの裏はそれぞれ確率変数です。

サイコロの場合であれば確率変数の値はサイコロの出目なので 1, 2, 3, 4, 5, 6 のいずれかになります。一般的に表現するために確率変数の値を X とおき、X = 1, 2, ... , 6 とるすわけです。

コイントスの場合であれば確率変数の値はコインの表、コインの裏のいずれかになります。数学で扱う場合はコインの表のことを 1、コインの裏のことを 0 とおくことが多いです。一般的に表現するために確率変数の値を X とおき、X = 0 または 1 とするわけです。

確率変数を一般的な用語で定義すると「試行を行うことで、その値が定まり、またその値をとる確率が決まるもの」となります。試行確率変数確率変数の値各確率変数の値がとりうる確率の 4 つの用語をサイコロの出目とコイントスを例に表にしてみました。

画像1

厳密に定義するとこのようになるのですが実際には教科書中でも微妙な使い方をしているものがあります。そこは問題視しても仕方ないので流すことにしましょう。私どものまとめでは可能な限り丁寧に用語を使います。

次に確率変数がとりうる値と、確率変数がその値をとる確率の対応関係を確率分布と言います。数式で表現できる場合もありますし表でしか表現できない場合もあります。確率分布という言葉から数式で表現可能なグラフを頭に浮かべている方も多いのではないか?と思っています。偶然に確率分布を数式で表現可能である場合もありますが、表でしか表現できない場合も多くあります。

確率変数が離散値である場合の確率分布を離散確率分布確率変数が連続値である場合の確率分布を連続確率分布と呼びます。何が違うのか丁寧に見ていきます。

確率変数が離散値であるとはどういうことでしょうか?離散ですから確率変数が飛び飛びの値をとるということです。サイコロの出目は離散値ですか?連続値ですか?離散値ですね。1, 2, 3, 4, 5, 6 の 6つの飛び飛びの値のみをとりえます。では確率変数が連続値になるとはどういう場合なのでしょうか。気温、身長などは連続値ですね。コストを無視すればどこまでも精度を要求することができます。

確率変数、確率分布が離散であるか連続であるかは非常に重要な考え方で、意識して区別する必要があります。区別する必要性については次回にまとめます。

G検定 / 統計検定 確率分布に関するまとめの続きは以下からどうぞ。

では、ごきげんよう。



この記事が気に入ったらサポートをしてみませんか?