見出し画像

【統計学入門】標準偏差

結論

・母集団のばらつきを表す数値
・値が大きいほどばらつきが大きい
・標準偏差をσ(シグマ)と呼ぶ
・母集団が正規分布する場合、±3σの間に99.7%のデータが含まれる

標準偏差とは

まず標準偏差はデータのばらつき度合いを表すものです。
例えば、学校のテストで二つのクラスの点数を見比べます。

画像1

この2つのクラスって平均点はどちらも50点ですが、
平均だけではこのクラスの実情は表せません。
そんな時に使うのが標準偏差!!
何やかんやで計算すると以下表のようになります。
標準偏差を見ると、クラスAは約40点分くらいばらついてるのがわかります。

※この標準偏差40点はあくまでも、ばらつき度合いを表すものなので
平均からMAX40点しかバラつかない!とかそういうもんじゃないです。
あくまでも標準偏差同士を比べて、こっちの母集団の方がばらついてるね〜
って見るものです。

画像2

計算方法

細かい計算方法はすっ飛ばしました。
うまく説明できる気がしないので、詳しくは以下サイトを参照
わかりやすいよ。

±3σのマジック

マジックを使う前提条件は
対象の母集団が正規分布していること!
ただこれのみ!
しかも基本的にはデータが十分に揃っている場合、正規分布になると言われているのでこの条件はすんなりクリアすると思います。

あと正規分布は、ヒストグラムを作成した時に綺麗な富士山型になったら正規分布していると言えるよ。
正規分布について詳しく知りたい人は下記サイトをチェック!

あとは標準偏差σに±3をかけて、-3σと+3σを求めて終わり!
±3σの範囲に99.7%のデータが集まってるよ。
製造現場ではこの±3σを使って、製品の品質管理を実施してます。

まとめ

ちょっと後半の説明は難しかったので、参考サイト様に頼りましたね。
ただどれもわかりやすいサイトなので、是非参考にして欲しいです

この3σがわかってくると、
工業製品って完璧じゃないということがわかってきます。
もし購入した製品が不具合品だったら
確かにすごく憤る気持ちもわかりますが
是非「0.03%に当たっちまったな」と思っていただけると幸いです。
※元製造関係者より

この記事が気に入ったらサポートをしてみませんか?