見出し画像

統計学の基本:分散の理解その1

統計学では「分散」が平均とセットでよく使われます。今回は分散を学ぶ前に、偏差について学びましょう。例えば、同年代の人たちの年収、クラスのテストの点数、ある株価の1年後の金額など、これまでの結果の平均値から予測を立てることができますが、実際には状況やタイミングによってばらつきがあります。これらの予測値からどれくらいずれる可能性があるかを知ることができれば、より計画が立てやすくなります。そこでばらつきを数値化することがよい方法です。

例として、あるファンドAの年ごとの価格を見てみましょう。

2000年 10,000円
2001年 10,400円
2002年 10,764円
2003年 11,517円
2004年 11,748円
2005年 12,746円

このファンドAの平均利率は5.0%です。

ファンドBについても考えてみましょう。

2000年 10,000円
2001年 10,350円
2002年 10,557円
2003年 11,402円
2004年 11,516円
2005年 12,725円

ファンドBの平均利率も同様に5.0%ですが、ファンドBは金額のばらつきが大きいです。つまりファンドBの方がリスクが大きいと言えます。

では、どのようにしてばらつきを数値するかをファンドAを例にしてみてみましょう。

2000年 10,000円
2001年 10,400円 年間利率:4.0% → 平均との差:-1.0%
2002年 10,764円 年間利率:3.5% → 平均との差:-1.5% 
2003年 11,517円 年間利率:7.0% → 平均との差:  2.0%
2004年 11,748円 年間利率:1.0% → 平均との差:-3.0%
2005年 12,746円 年間利率:8.5% → 平均との差:  3.5%

このように平均との差を計算すれば、期待していた結果からどれくらいずれたかを表すことができます。このずれを偏差と呼びます。

偏差は次のように表されます。

$${x_1,x_2,・・・,x_n}$$の平均を$${μ}$$としたとき、
$${x_n - μ}$$
を偏差と呼びます。

ファンドBについても同様に調べてみましょう。

2000年 10,000円
2001年 10,350円 年間利率:  3.5% → 平均との差:-1.5%
2002年 10,557円 年間利率:  2.0% → 平均との差:-3.0% 
2003年 11,402円 年間利率:  8.0% → 平均との差: 3.0%
2004年 11,516円 年間利率:  1.0% → 平均との差:-4.0%
2005年 12,725円 年間利率:10.5% → 平均との差:  5.5%

これらの計算を通じて、ファンドBがファンドAよりもおおきなばらつき、つまりリスクが高いことがわかります。次回はこの内容をさらに掘り下げていきたいと思います。


この記事が気に入ったらサポートをしてみませんか?