観測値分布の計算方法とデータの比較方法

2024年5月21日 18:44

あるi番目の観測値(Ai)について、平均(A)からの差分を取る場合

偏差= 観測値-平均値 = Ai-A

とすることができる。

この場合、
n個のデータが揃っていると仮定すると、

平均偏差=(|An-A|の合計)÷n
(偏差の絶対値の平均)

分散={(An-A)の合計の2乗}÷n
(偏差を平方した値の平均)

標準偏差=√分散
(分散の正の平方根)

上記の指標により、データの散らばり方を数値としてわかりやすくする。

しかし、それだけでは平均値とデータの散らばり方の相対的な関係を計ることができない。
その場合は変動係数を比較することで、相対的な観測値の分布を観察することができる。

変動係数=標準偏差÷平均値

として計算する。

これらの計算から得られたデータを比較するとき、平均値や標準偏差が大きく異なる場合や、測定単位が異なる場合がある。

そういった場合、観測値Ai、i=1、...、n、..に対して、次のようにしてデータの標準化を行う。

Zi = 観測値-平均値÷標準偏差=各観測値の偏差÷標準偏差

Zi=Z値、またはZスコアという。
このZ値は標準化された値、ということになる。

この処理によって標準化された値は、平均値0、標準偏差1、となる。

ex)試験の偏差値
=得点-得点の平均値÷得点の標準偏差×10+50
=10Zi+50

この記事が気に入ったらサポートをしてみませんか？