Excelを使った統計解析(5) - 正規分布の性質
正規分布の性質
今回は統計や確率に深く関わっている、正規分布の性質について整理していきたいと思います。完全な証明は割愛しますが、正規分布には以下の特徴があります。
平均と標準偏差の関係には大きな意味があります。例えば製品の販売数が正規分布に従う場合は、平均+標準偏差の3倍に販売数を納めれば品切れになる確率は0.3%以下になり、ロスを減らすことができます。
正規分布となる分布をExcelで解析
正規分布の確率について、NORMDIST関数を使って計算をしていきます。
今回はA工場にて平均重量45g・標準偏差10g、B工場にて平均重量55g・標準偏差15gの食品を製造している場合を検証してみます。
同じ標準分布の製品でも、このようにパラメータが異なると中央値や確率の分布・傾斜に差が出ます。分布が標準偏差であることと、平均値・標準偏差をあらかじめ導出しておけばこのように製品の品質のばらつきの予測などに役立てることができます。
標準正規分布
データサイエンスにおいては正規分布の形をとる分布を標準化し、分析器が数値を理解しやすくするケースが多くあります。そこで、今回はExcelを使ってA工場・B工場のデータを標準化する処理を行いたいと思います。
標準化は、
標準化後データ = ( データ - データの平均値 ) / データの標準偏差
という数式で行われます。ExcelではSTANDARDIZE関数を使ってこの値を導出することができます。
次回はカイ2乗分布とt分布について、それが終わったら区間推定と検定について書きたいと思います。更新は次週以降になる予定です。お楽しみに!
この記事が気に入ったらサポートをしてみませんか?