![見出し画像](https://assets.st-note.com/production/uploads/images/141674600/rectangle_large_type_2_d4455e9f83ce467d2876e1b9a0d708d6.jpg?width=800)
Photo by
cheeko829
観測値分布の計算方法とデータの比較方法
あるi番目の観測値(Ai)について、平均(A)からの差分を取る場合
偏差= 観測値-平均値 = Ai-A
とすることができる。
この場合、
n個のデータが揃っていると仮定すると、
平均偏差=(|An-A|の合計)÷n
(偏差の絶対値の平均)
分散={(An-A)の合計の2乗}÷n
(偏差を平方した値の平均)
標準偏差=√分散
(分散の正の平方根)
上記の指標により、データの散らばり方を数値としてわかりやすくする。
しかし、それだけでは平均値とデータの散らばり方の相対的な関係を計ることができない。
その場合は変動係数を比較することで、相対的な観測値の分布を観察することができる。
変動係数=標準偏差÷平均値
として計算する。
これらの計算から得られたデータを比較するとき、平均値や標準偏差が大きく異なる場合や、測定単位が異なる場合がある。
そういった場合、観測値Ai、i=1、...、n、..に対して、次のようにしてデータの標準化を行う。
Zi = 観測値-平均値÷標準偏差=各観測値の偏差÷標準偏差
Zi=Z値、またはZスコアという。
このZ値は標準化された値、ということになる。
この処理によって標準化された値は、平均値0、標準偏差1、となる。
ex)試験の偏差値
=得点-得点の平均値÷得点の標準偏差×10+50
=10Zi+50
この記事が気に入ったらサポートをしてみませんか?