One point統計学~区間推定
某局人気番組の視聴率14%、内閣支持率35%…などはよく目にしますが、視聴率の測定器が設置されている家庭や調査員に直接聞かれた人はめったにいませんね。有権者全体やテレビを持つ全世帯の調査は現実的に難しいので、無作為に抽出した一部の有権者や世帯(標本)に対して支持率や視聴率(標本比率)を調べるのが普通です。35%という数字は、全有権者(母集団)の支持率(母比率)ではなく一部の有権者の支持率に過ぎません。
この35%を真の支持率の推定値とする考え方もアリですが、今日は
「母比率が0.32~0.38である確率は95%」
というような、推定値に幅を持たせ確率とセットで推定する区間推定の考え方をお話します❣
無作為に選んだ1000人にアンケートを取った結果、内閣支持率が35%だとします。このことから有権者全体の支持率について何が言えるでしょう?この1000人に支持者が偶然多く集まったかもしれないし、その逆もあり得るし…。
先ほどの1000人を標本1とし,別の1000人を標本2,…というように標本をいくつも取ったとすると、各標本の支持率(標本比率)は普通、標本ごとに異なります。そして標本比率の値の分布は、ある値の近辺に現れる頻度が高く、そこから離れるほど現れにくくなることが観察できます。標本比率はその値に確率が紐づけられている、つまり確率変数なんです❣
標本の大きさが十分大きいとき、標本比率の分布法則は母比率を中心とする左右対称の小山型曲線で表され、
母比率±0.03の区間に標本比率が含まれる確率は95%
ということが分かっています。 ㊟母比率は未知!
この分布法則を利用した、区間推定の方法をご紹介します❣
もう少し詳しく言うと…
標本比率は標本抽出ごとに値が決まるので、信頼区間の端点の値が標本ごとに異なり(信頼区間は変動)ます。なので、「母比率の信頼度95%の信頼区間が0.32~0.38」というのは「標本抽出100回中95回起こる程度の確からしさで母比率は0.32~0.38に含まれる」という意味です。
ここで「なぜ信頼度は95%?」と思うかも知れませんが、信頼度50%で云々…と言われても「それで?」ってなりますよね。推定の信頼度は高い方が良いので90、95、99%がよく使われるんです。
今日は、1000人の支持率35%という結果から真の支持率を区間の幅+確率で推定する方法のザックリ解説でした❣
ではまた👋
この記事が気に入ったらサポートをしてみませんか?