見出し画像

【統計学】標準偏差と標準誤差 どう違うの?

この記事では、
統計を勉強していると出てくる標準偏差標準誤差について、わかりやすく解説していきます。

この二つ、似ているようで実は全然違うんです。
でも、多くの人が混乱してしまうんですよね。

大丈夫です!

この記事を読めば、きっと「なるほど!」と思えるはずです。
一緒に学んでいきましょう!


標準偏差とは


まず、標準偏差から説明していきますね。
標準偏差って、難しそうな言葉に聞こえるかもしれませんが、
実はとってもシンプルな概念なんです。

簡単に言うと、標準偏差は「データのばらつき具合」を表す指標です。
例えば、クラスのテストの点数を考えてみましょう。
全員が70点だったら、ばらつきはゼロですよね。
でも、60点の人もいれば90点の人もいたら、ばらつきが発生します。

標準偏差は、このばらつきを数値で表したものなんです。
大きな数字ならばらつきが大きい、小さな数字ならばらつきが小さいと考えてください。

計算方法は少し複雑ですが、イメージとしては「平均値からの距離の平均」と考えるといいでしょう。



標準誤差とは


次は標準誤差です。
これは少し難しい概念かもしれませんが、ゆっくり説明していきますね。

標準誤差を理解するには、
まず、「母集団」と「標本集団」という概念を理解する必要があります。

これらは統計の世界ではとても大切な概念なんです。

「母集団」は、調べたい対象全体のことを指します。
例えば、「日本人の平均身長を知りたい」と思ったら、日本人全員が母集団になりますね。
でも、日本人全員の身長を測るのは大変ですよね?
そこで登場するのが「標本集団」です。
これは母集団の一部分で、実際に調査する対象のことです。
例えば、日本人1000人を無作為に選んで身長を測る、というような感じです。

さて、ここからが本題です。
私たちが知りたいのは「母集団の平均」(母平均)ですが、
実際に計算できるのは「標本集団の平均」(標本平均)だけです。
ここで疑問が生まれますよね。

「標本平均は、本当の母平均とどれくらい違うんだろう?」

この疑問に答えてくれるのが「標準誤差」なんです!

標準誤差は、標本平均が母平均からどれくらいズレているかを教えてくれる指標なんです。

標準誤差が小さければ小さいほど、
「この標本平均は母平均にかなり近いんじゃないかな」と考えられます。

逆に大きければ、「うーん、もしかしたら結構ズレているかも」と思わなければいけません。

面白いことに、調査する人数(標本サイズ)が多くなればなるほど、標準誤差は小さくなります。つまり、たくさんの人を調べるほど、より正確な推測ができるんですね。
標準誤差は、例えば選挙の出口調査の結果がどれくらい信頼できるかを判断したり、新薬の効果を評価したりする時にとても重要になります。

計算式

標本平均の標準誤差は以下のように計算されます:

(n: サンプルサイズ)

特性

サンプルサイズが大きくなるほど、つまり、√n が大きくなるほど、標準誤差は小さくなります。さきほどの例と同じです。何となく直感的にも理解できますね。


どんな場面で使う?


標準偏差


改めてですが、標準偏差は、データのばらつきを示す指標です。
データが平均値からどれくらい離れているかを表します。

具体的な使用例

例えば、クラスのテスト結果を分析する時に使います。平均点が80点で標準偏差が10点だとしましょう。
この場合、多くの生徒の点数が70点から90点の間に分布していることがわかります。


標準誤差


標準誤差は、標本平均の精度を示す指標です。
母集団の真の平均値と、標本から得られた平均値との差の程度を表します。

具体的な使用例

例えば、政党への支持率を調査する際に使用します。
母集団の支持率の平均値は分かりませんが、標本集団での支持率の平均値・標準偏差は分かります。
標本集団から計算された支持率の平均値が60%で、標準偏差をサンプル数で割った標準誤差が3%だったとします。
この場合、母集団の支持率は、60%±2×標準誤差の範囲、つまり、54%から66%の間にある可能性が高いことを示しています。

標準誤差に2をかけていますが、これは約95%の確率で、この範囲に収まる可能性が高いということを意味しています。
この確率のことを信頼区間と呼びます。

サンプル数がさらに大きくなれば、
標準誤差も小さくなります。
例えば、標準誤差が1%まで小さくなれば、
真の支持率は、60%±2×1%の範囲、つまり、58%から62%に入る可能性が高かまり、差の程度が縮まることになります。


標本誤差とは


ここで、もう一つ混同しやすい概念を紹介しておきましょう。
それは標本誤差です。

標本誤差は、サンプル(標本)から得られた結果と、実際の母集団全体の結果との差を指します。
例えば、1000人のアンケートから得られた結果と、国民全員に聞いた場合の結果との差ですね。

一般的に、標本誤差を直接認識することはできません。

母集団の結果が認識できないからですね。

だから、標準誤差があるのです。標準誤差は標本誤差の推定値なのです。

それにしても、標⚫︎⚫︎差の⚫︎⚫︎に何を入れるかで3つの概念があるなんて、本当に紛らわしいですよね。

さいごに


いかがでしたか?
標準偏差と標準誤差、そして標本誤差について理解できましたか?

統計学は最初は難しく感じるかもしれません。
でも、一つ一つの概念をしっかり理解していけば、きっと楽しくなってきますよ。これらの概念は、日常生活でもビジネスでも、データを正しく理解し解釈する上でとても重要です。

次にデータを見る時は、「これは標準偏差?それとも標準誤差かな?」と考えてみてください。
そうすることで、データの本当の意味がわかってくるはずです。

統計学の世界を楽しんでください!

よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!