【統計学とはこんな学問だ!!】平均編
はじめに:平均だけじゃデータは信用しきれない
こんにちは。今回から統計に関する記事を書いていきます。学び直しをしたい大人の方や、統計学に興味のある高校生に向けてわかりやすく書いていきます。
平均はデータの集団の中で「だいたいこれぐらいの値」といういい指標として使われると思います。統計学を学ぶと、平均だけを頼りデータを信用できないことが実感できると思います。
ここで、5人クラスのA組とB組でテストをしたとしましょう。点数と平均点がこのようになったとします。
もしもあなたが、A組, B組で75点を取った場合どのような気持ちになるでしょうか?
理由:データ次第では良い指標にならないから
まず、両方のクラスの平均点は70点です。平均点を取ると喜ぶことができるはずです。A組では喜べると思います。クラスで1番の点数を取れましたね。しかし、B組ではどうでしょうか?平均点を超えているのにクラスで4番目の点数ですね。20点の方がいるため、平均点に大きく影響が出たためです。平均点が万全という値ではないのです。
実際のデータによって平均が当てになる場合と当てにならない場合があるのです。
データの集団の中で「だいたいこれぐらいの値」といういい指標はそもそも代表値といいます。平均値以外にも代表値は存在するので紹介します。
平均値は、各値の合計を値の数だけ割るものです。
中央値は、データを小さい順に並べた後に、真ん中にある値です。
最頻値は、一番データの数が多い値です。
具体例:実際に計算してみよう
さりげなく、平均点を出してはいますが、平均を計算してみましょう。
平均値は70であることを確認しました。データの個数が5つなので5で割ることに気を付けましょう。B組では平均値が当てにならないので、次は中央値を求めてみます。
この場合、中央値は代表値としての役割を務めているのではないでしょうか。データの中で、だいたいこれぐらいの値となっています。最後に最頻値も求めてみます。
最頻値も中央値と同じく、データの中でだいたいこんぐらいを指していますね。
まとめ:平均では何か足りない
平均値以外の代表値を紹介しました。中央値、最頻値もデータを見るにあたって重要な値なので、是非チェックしてみましょう。
ただし、中央値や最頻値は計算しずらく、数える必要があることが難点です。平均をどうにか使えないものでしょうか?という問いに対して次回は答えていこうと思います。次回はこちらから!
この記事が気に入ったらサポートをしてみませんか?