【学練・統計】分散・標準偏差でバラツキを見破れ!

こちらも欠かせない項目です。分散・標準偏差はいわゆるひとつの「バラツキ、平均からのズレ」ですね~(N島監督風に)

偏差は、とある値と平均との差。学校で偏差値といわれるのもここからですね。偏差値が高いと平均より高いってことになるのでしょう。
ってことは偏差値90とかめっちゃ高いやんっていっているってことは基準が0ってことなのかな!?そうなるな。。


分散は、こちらもバラツキを求めるものですが、プラスとマイナスがあるとややこしい!ってことで2乗してすべてプラスしたうえでデータを合計することで比較するのです。(こちらは「偏差平方和」といいます。)
ただ、データが多くなると計算が大変、、25,-56,-120,87...と続くとうへぇ・・ってなりますからね。そこで先ほどだした2乗して合計した値をデータ数で割るのです!そしたら「分散」の出来上がり!

標準偏差は、上記で書いた分散を用いるのですが分散は元の値より2乗しているのでこちらを2乗を外して同じ単位に戻す。これがルート(√)をつけることでできます。こちらが標準偏差。
分散を長く書いた分、標準偏差は説明がシンプル(笑)

平均以外にもバラツキ度を見ることで値が比較的まとまってるなぁとかバラバラだなぁというのがわかればデータを見るのも楽しくなってきます、、よね?(笑)「あれ?私の年収低すぎ?」っていう広告も偏差値を見て思ったのかも!でもいっぱいのデータを見たときってどうしても外れ値が目立ちますからね!気になっても仕方ない!

この記事が気に入ったらサポートをしてみませんか?