見出し画像

【統計学とはこんな学問だ!!】平均編


はじめに:平均だけじゃデータは信用しきれない


 こんにちは。今回から統計に関する記事を書いていきます。学び直しをしたい大人の方や、統計学に興味のある高校生に向けてわかりやすく書いていきます。

平均はデータの集団の中で「だいたいこれぐらいの値」といういい指標として使われると思います。統計学を学ぶと、平均だけを頼りデータを信用できないことが実感できると思います。

A組:75, 70, 66, 66, 73  平均点:70点
B組:75, 83, 20, 89, 83  平均点:70点

 ここで、5人クラスのA組とB組でテストをしたとしましょう。点数と平均点がこのようになったとします。
 もしもあなたが、A組, B組で75点を取った場合どのような気持ちになるでしょうか?



理由:データ次第では良い指標にならないから


A組:75, 70, 66, 66, 73  平均点:70点
B組:75, 83, 20, 89, 83  平均点:70点

<再掲>

 まず、両方のクラスの平均点は70点です。平均点を取ると喜ぶことができるはずです。A組では喜べると思います。クラスで1番の点数を取れましたね。しかし、B組ではどうでしょうか?平均点を超えているのにクラスで4番目の点数ですね。20点の方がいるため、平均点に大きく影響が出たためです。平均点が万全という値ではないのです。

実際のデータによって平均が当てになる場合と当てにならない場合があるのです

 データの集団の中で「だいたいこれぐらいの値」といういい指標はそもそも代表値といいます。平均値以外にも代表値は存在するので紹介します。

平均値
・中央値(メジアン)
・最頻値(モード)

代表値三選!!
  • 平均値は、各値の合計を値の数だけ割るものです。

  • 中央値は、データを小さい順に並べた後に、真ん中にある値です。

  • 最頻値は、一番データの数が多い値です。


具体例:実際に計算してみよう


A組:75, 70, 66, 66, 73  平均点:70点
B組:75, 83, 20, 89, 83  平均点:70点

<再掲>

 さりげなく、平均点を出してはいますが、平均を計算してみましょう。

A組:$${( 75 + 70 + 66 + 66 + 73 ) ÷ 5 = 350 ÷ 5 = 70}$$
B組:$${( 75 + 83 + 20 + 89 + 83 ) ÷ 5 = 350 ÷ 5 = 70}$$

 平均値は70であることを確認しました。データの個数が5つなので5で割ることに気を付けましょう。B組では平均値が当てにならないので、次は中央値を求めてみます。

まずは、データを小さい順に並び替えます。
A組:66, 66, 70, 73, 75
B組:20, 75, 83, 83, 89
データの個数は5つなので、真ん中は3番目になります。よって、3番目の値が中央値になります。
A組:中央値 70  B組:中央値 83

 この場合、中央値は代表値としての役割を務めているのではないでしょうか。データの中で、だいたいこれぐらいの値となっています。最後に最頻値も求めてみます。

登場回数が一番多いデータを最頻値といいます。
A組:75, 70, 66, 66, 73  ・・・66は2回、その他は各々1回
B組:75, 83, 20, 89, 83  ・・・83は2回、その他は各々1回
よって、A組は75が一番多く、B組は83が一番多い。
A組:最頻値 66  B組:最頻値 83

 最頻値も中央値と同じく、データの中でだいたいこんぐらいを指していますね。


まとめ:平均では何か足りない


 平均値以外の代表値を紹介しました。中央値、最頻値もデータを見るにあたって重要な値なので、是非チェックしてみましょう。

 ただし、中央値や最頻値は計算しずらく、数える必要があることが難点です。平均をどうにか使えないものでしょうか?という問いに対して次回は答えていこうと思います。次回はこちらから!


この記事が参加している募集

数学がすき

この記事が気に入ったらサポートをしてみませんか?