見出し画像

Excelを使った統計解析(5) - 正規分布の性質

正規分布の性質

今回は統計や確率に深く関わっている、正規分布の性質について整理していきたいと思います。完全な証明は割愛しますが、正規分布には以下の特徴があります。

①、分布の中央にデータの平均値・最頻値がある
②、分布の中央から遠ざかるほど平均からの偏差が大きくなり、頻度が小さくなる
③、偏差が大きいほど傾斜が小さくなる。偏差と傾斜が反比例している
④、平均±標準偏差 の範囲にデータの全体の68%が入る
⑤、平均±標準偏差2 の範囲にデータの全体の95%が入る
⑥、平均±標準偏差3 の範囲にデータの全体の99.7%が入る
⑦、分布の中央は最も発生する確率が高い
➇、分布の中央から離れると発生する確率は低くなる
⑨、確率の合計(分布の面積)は1になる

平均と標準偏差の関係には大きな意味があります。例えば製品の販売数が正規分布に従う場合は、平均+標準偏差の3倍に販売数を納めれば品切れになる確率は0.3%以下になり、ロスを減らすことができます

正規分布となる分布をExcelで解析

正規分布の確率について、NORMDIST関数を使って計算をしていきます。
今回はA工場にて平均重量45g・標準偏差10g、B工場にて平均重量55g・標準偏差15gの食品を製造している場合を検証してみます。

同じ標準分布の製品でも、このようにパラメータが異なると中央値や確率の分布・傾斜に差が出ます。分布が標準偏差であることと、平均値・標準偏差をあらかじめ導出しておけばこのように製品の品質のばらつきの予測などに役立てることができます。

異なる平均値・標準偏差をもつ正規分布の確率変数・累積確率の分布の図

標準正規分布
データサイエンスにおいては正規分布の形をとる分布を標準化し、分析器が数値を理解しやすくするケースが多くあります。そこで、今回はExcelを使ってA工場・B工場のデータを標準化する処理を行いたいと思います。

標準化は、
標準化後データ = ( データ - データの平均値 ) / データの標準偏差
という数式で行われます。ExcelではSTANDARDIZE関数を使ってこの値を導出することができます。

次回はカイ2乗分布とt分布について、それが終わったら区間推定と検定について書きたいと思います。更新は次週以降になる予定です。お楽しみに!

この記事が参加している募集

数学がすき

この記事が気に入ったらサポートをしてみませんか?