G検定 / 統計検定 標本調査 #1

株式会社リュディアです。新しいG検定のシラバスにも追加されていた統計検定対策まとめです。今回から標本調査についてまとめていきます。

例えば日本に居住している勤労者の平均年収を調べたいとします。日本に居住している勤労者全員を対象とした調査を行えば正確なのですが時間コストも人的コストも膨大なものになることが予想されます。そこで日本に居住している勤労者全員ではなく一部の勤労者を調査対象とすることを考えます。よくある考え方ですよね。この考え方の中に既に統計学における標本調査のエッセンスが多数含まれています。次の図を使いながら説明していきます。

画像1

母集団:日本に居住している勤労者、理想的な調査対象
標本:調査対象となる一部の勤労者、現実的な調査対象
標本の大きさサンプルの大きさ:抽出した調査対象となる勤労者の人数、サンプルサイズとも呼ぶ、後述しますがサンプル数とは異なるので注意ください。
抽出母集団から調査対象を選択すること
全数調査:母集団 = 勤労者全体を対象とした調査
標本調査:標本 = 一部の勤労者を対象とした調査

上の図では日本の各地から勤労者を抽出していますがどのように抽出すべきなのでしょうか。抽出する際に偏らないようにすることが重要であることはわかりますね。このような場合に単純無作為抽出という方法が基本となります。母集団からランダムに標本を抽出する方法です。具体的には乱数を使って標本を抽出することが多いです。

ここで抽出方法には2つの方法があります。復元抽出非復元抽出です。袋に入った赤、白の2色のボールがそれぞれ50個ずつの合計100個あります。この袋からランダムに10個取り出し、赤白それぞれいくつずつあるかを調査する例を考えます。復元抽出と非復元抽出の説明でよく使われる例です。

10個のボールを取り出し赤白それぞれの個数を数えたら次にさらに10個を取り出し調査を行います。このときに復元抽出と非復元抽出では以下のような違いがあります。

復元抽出先に取り出した10個のボールを戻してから再度10個のボールを取り出す、つまり二回目でも 100個のボールから10個のボールを取り出す
非復元抽出先に取り出した10個のボールを戻さずに再度10個のボールを取り出す、つまり二回目では 90個のボールから10個のボールを取り出す

10個のボールを取り出す調査を何度か繰り返すときに調査済のボールを戻すか戻さないかの差です。ちなみに10個のボールを取り出す調査を何度か繰り返す回数を標本数、あるいはサンプル数と呼びます。最初に説明した標本の大きさ = サンプルサイズと混乱しないようにしてくださいね。

標本の大きさ = サンプルサイズ
標本数 = サンプル数

であることを理解し用語の違いをしっかりと理解してください。

G検定 / 統計検定 標本調査に関するまとめの続きは以下からどうぞ。

では、ごきげんよう。


この記事が気に入ったらサポートをしてみませんか?