分散(標準偏差)を考える理由
Aさん: 「教授、僕は今、二つの会社のどちらに入社するか迷っています。どちらも月の売り上げの平均は100万円で同じなんです。でも、どちらが良い会社なのか分かりません。」
教授: 「それは興味深いね、Aさん。でも、平均だけではどちらの会社が安定しているかは分からないよ。安定した会社を探すためには、『分散』と『標準偏差』という概念が重要だ。」
Aさん: 「分散って何ですか?標準偏差は聞いたことがありますが…」
教授: 「分散は、データがどれだけ平均から離れているかを示す指標だよ。具体的には、各データが平均からどれだけ離れているかを計算し、その結果を2乗して平均を取ったものが分散だ。分散が大きいほどデータのばらつきが大きく、安定性が低いと考えられるんだ。」
Aさん: 「それだけ聞くと、分散だけで良さそうですね。標準偏差は何が違うんですか?」
教授: 「良い質問だね。分散はばらつきの大きさを表すけれど、分散の単位は元のデータの単位の2乗になってしまう。例えば、売り上げの単位が万円だと、分散の単位は万円²になる。それでは直感的に分かりにくい。そこで、分散の平方根を取って元の単位に戻したものが標準偏差なんだ。これで、データのばらつきを元の単位で理解できるんだ。」
会社Aと会社Bの月別売り上げデータ:
会社A: 98万円, 102万円, 101万円, 99万円, 100万円
会社B: 120万円, 80万円, 105万円, 95万円, 100万円
教授: 「では、これらのデータを使って分散と標準偏差を計算してみよう。」
分散と標準偏差の計算:
会社Aの売り上げデータ: 会社Bの売り上げデータ:
98, 102, 101, 99, 100 (万円) 120, 80, 105, 95, 100 (万円)
→ 平均: 100万円 → 平均: 100万円
→ 分散は4万円² → 分散は196万円²
→ 標準偏差は2万円 → 標準偏差は14万円
教授: 「このように、会社Aの分散は4万円²、会社Bの分散は196万円²だ。分散を使っても会社Bのばらつきがかなり大きいことが分かる。でも、分散は単位が²になってしまうから、直感的に理解しづらい。そこで、分散の平方根を取って標準偏差として表すことで、元の単位でばらつきを比べることができるんだよ。会社Aの標準偏差は2万円、会社Bの標準偏差は14万円だ。」
Aさん: 「なるほど!分散でばらつきの大きさを比較できるけど、標準偏差を使うと、元の単位でわかりやすくなるんですね。」
教授: 「その通り。標準偏差が小さいほど、その会社の売り上げは安定していると言えるよ。Aさんが安定を重視するなら、標準偏差が小さい会社Aの方が向いているかもしれないね。」
Aさん: 「ありがとうございます!これで会社Aが売り上げの変動が少なく、安定しているということがしっかり理解できました。」
教授: 「そうだね。平均だけでなく、分散や標準偏差を見ることで、データの安定性や散らばりを客観的に評価できるようになるんだよ。
ちなみに株式投資の『リスク』の正体も標準偏差なんだよ。」
まとめ
分散はデータのばらつきの大きさを表すが、単位が元のデータの2乗になってしまう。
標準偏差は分散の平方根を取って元の単位に戻したもの。これにより、直感的にばらつきを理解できる。
会社Aは標準偏差が2万円で、売り上げの変動が比較的小さい。
会社Bは標準偏差が14万円で、売り上げの変動が大きい。
この記事が気に入ったらサポートをしてみませんか?