確率変数、普通の変数、確率、確率分布

2021年3月21日 02:32

前回の記事では、統計学の立場と事象について述べたので、ここでは②確率に関することを記述します。まず、「統計学」という言葉が複数の立場を持つように、「確率」という言葉にも複数の立場があります。「頻度主義的確率」「主観主義的確率」などと呼ばれるそれで、同じ確率という言葉によって表現されるものですが指し示しているものが異なります。頻度主義的確率、主観主義的確率ともに共通するのは、ある事象が出現する確率という値は、全事象のうちに占める目的事象の割合と定義することですが、この割合を定義するプロセスに差があるのです。

「頻度主義的確率」では、人間の信念を排除し、観測事実に基づいて確率を定義しようとします。例えば、サイコロを振った時に1の目が出る確率を定義する際には、サイコロを振った回数をN回、そのうち1の目が出た回数をn回とすると、「サイコロを振った時に1の目が出る確率はn / Nである」と主張します。サイコロを振った時に1の目が出る確率は、測定によって異なる確率を示すことになりますが、測定時の試行回数を多くしていくとある値に収束していきます（大数の法則）。そして、試行を無限回繰り返した時の収束値が真の確率となります。一方、我々は有限の世界に生きているため、無限回の思考を繰り返すことが出来ないので、厳密に真の確率を得ることはできないことになります。

「主観主義的確率」では、人間の信念に基づいて確率を定義しようとします。例えば、サイコロを振った時に1の目が出る確率について、そのサイコロについての情報が他に存在しない場合、1~6の目それぞれが出る確率は等しいと仮定します。つまり、全事象 = 1を６等分した世界のうちの1つがサイコロの目が1となった世界なので、その割合は1 / 6である、と主張します。この方法による定義は試行を要しないのですが、例えばサイコロの重心がズレており若干4の目が出やすくなっているなど、事前に得ていない情報がある場合に真の確率に対して異なる値を得てしまうリスクがあります。

例えば、ベイズ統計においては最初に信念に基づいて確率分布を定義しますが、これは完全に主観主義的な確率の立場を取ります。これに対してベイズ更新と呼ばれるプロセスで観測情報を付与していき、徐々に信念（認識）を現実の世界に近づけていく、という手法で真の確率分布（の近似値）を探査する、という方法となります。

さて、お次に引っかかるポイントは、確率変数の考え方、特に普通の変数と確率変数の違いについて、となります。まず、確率変数とは、確率的に値が変化する値のことをさします。例えば、サイコロの例ではサイコロを振った時に出た目は確率変数として扱うことが出来ますし、ここでサイコロの出た目の10倍の値を得点とすると、サイコロを振った時に得られる得点も確率的に変化する値になるので確率変数です。サイコロを振った時に出た目を確率変数Xとすると、1の目が出た世界はX = 1としてあらわすことが出来ます。また、１の目が出る確率は、よくP(X = 1)として表現することになります。一方、普通の変数はこれとは違い、ただ単に不定な値、あるいは未知な値を示します。例えばサイコロを振ったケースの場合、出る目をいちいち1、２，、、、と書き表すのはとても面倒です。従って、X = x（x ∉{1, 2, 3, 4, 5, 6}）などと示します。Xとして個別の値をとるだけでなく、集合としてXの属する条件がxを使って書かれることもあります。また、設定する問題によっては、xはサイコロの目のように離散的な値ではなく、連続的な値を取ることもあります。この場合、P(X = x）は任意のxに対して0をとります。これは連続に定義によります。一方、P(x < X < x + δx）は0以外の値を取ることもあります。

最後に、確率分布についてです。これは、確率変数Xがある値xを取るときの確率P(X = x)をxの関数として示したものです。推測統計では、最初に帰無仮説と対立仮設を用意し、帰無仮説に基づいてある確率分布に従うデータ生成構造を設定します。そして、得られた観測データがこの帰無仮説の主張するデータ生成構造によって生成されたものである確率を、観測データによって得られる統計量に基づき、「観測データが設定したデータ生成構造によって生成されたものとは有意に異なるか」を検定することになります。この基準は推測者によって定めることが可能であり、「有意水準」と呼ばれます。このため、推測統計では確率分布と統計量を扱うことが中心命題になってきます。

この記事が気に入ったらサポートをしてみませんか？