見出し画像

【統計】誤差の話。

これは父から聞いた話をアウトプットしたものです。

よくテレビやCMで、「渋谷にいる女子100人に聞いた、〇〇している人の割合」など、統計的手法を用いているように見せた映像が流れています。

ここでの渋谷女子は「母集団」といい、調査対象の全体を指します。
一方、渋谷にいる女子100人は「標本」といい、実際に調査対象になり母集団の一部を指します。

母集団から標本を取り出すことを「抽出」と呼び、母集団から無作為に標本を抽出する方法を「無作為抽出」と呼びます。

ここで、疑問が生じます。抽出する標本の数(以下、大きさという)はどのくらいが望ましいのでしょうか。

これには、誤差が関係します。

一般に、抽出すべき標本の大きさは、1を誤差の二乗で割ったものだと言われています。

例えば、10%の誤差にする場合、必要な標本の大きさは、1/(0.1×0.1)=100になります。逆に、標本の大きさが100である場合、想定される誤差は10%ということです。

冒頭の「渋谷女子100人に聞いた」の例では、10%の誤差を含んでいると言えますね。それよりも大きさが小さい場合は、誤差は大きくなります。

つまり、どれだけの誤差を想定するかによって、抽出される標本の大きさが定まってくるのです。ですから、ある程度の誤差が許容されるケースでは、標本の大きさは大きければ良いとは言えないのです。

TVやCMで見かける統計チックな映像を注意してみてみましょう。

注)記事内容に間違いがありましたら、コメント欄にてご教授いただければと思います。




この記事が参加している募集

就活体験記

この記事が気に入ったらサポートをしてみませんか?