標準偏差って何?
文系人間の私がある程度は学んだものの何となくわかったような顔をしてやりすごしてきた統計学。そこで基礎からぼちぼち学び直ししておこうということでこれから少し綴っていこうと思います(毎週金曜日更新)。
今日は標準偏差についてです。
標準偏差とは
まず、その前に知っておかなくはならない記号、Σ(シグマ)について確認します。
数学アレルギーのある人はこのマーク見た段階で嫌になるって人もいます。
実はこれ自体は単純に説明するとすごく簡単で、”全部をたすこと”を意味します。
n個があるとして、n個全部を足し合わせるという意味です。
横にn分の1がつくと、
n(個数分)で割ることなので、平均を求めるということになります。
偏差・分散
グループのデータが集まっていて平均を出した時に、それぞれの差が平均からどれくらい差があるのかを求めます。それが、偏差です。
例えば、平均点65点で実際に60点だったすると偏差は-5です。
偏差は平均からの乖離をざっくりと見るだけならいいのですが、データ全体がどの程度ばらついているのかを知らないと実際に60点がどの程度の位置づけなのかがわかりません。
その時に、それぞれのデータの平均からの偏差を2乗します。
なぜ、2乗するのかというと、2乗しないと70点の偏差 -5と70点の偏差 +5を足すと相殺されてゼロになってしまうからです。
だから、2乗した偏差の合計の平均を出すのです。このように求めたものが分散と言われるものです。
分散がデータのばらつきを示す指標となります。
ところが、この分散の数値ですが、元の数値から2乗しているためにこのままでは使えないです。
平方根(√)を求めなる必要があります。
そうやって求めたものが標準偏差なのです。
データのばらつきを見るための標準偏差(SD)ですが、実際に同様に使われるのか?です。
正規分布とSD
上の図は正規分布の図ですが、平均±1SDの中に68.27%のサンプルが収まることを意味します。±2SDですと95.43%で、±3SDですと99.73%です。
標準偏差を求めると各データがどのくらい平均から乖離しているのかを知ることができるのです。
ちなみに、受験勉強でよく耳にする偏差値ですが、平均と標準偏差の影響を取り除いた指標として標準得点を算出し、平均が50、標準偏差が10になるように加工された変数を導き出し、学力テストなでどで相対的な位置付けを確認しやすくするために作られたものです。
まとめ
まずは統計の基本中の基本として標準偏差とはについてでした。
文章だけだとわかりづらいかもしれませんので、次回以降もっと数式の例示ができるようにしていきます。
最後までお読みいただきありがとうございます。
参考文献はこちらです。