平均値と中央値の違いを知らないとデータを見誤る
平均値と中央値、両者は似たような意味を持っているように見えますが、実はまったく違った数値です。
平均値は、集めた数値をすべて足し、集めたデータの数で割った数値です。
中央値は、集めた数値を並べて真ん中に来る数値のこと指します。
この二つは、データ分析の基礎ですが、それぞれの活用場面が異なるので混同しないように気をつけなくてはいけません。
例えば、クラスでテストを行った時、平均値を求めるとクラス全員の点数を足してその合計を人数で割ります。
中央値を導く場合は全ての人の点数を並べて真ん中に来る数値を探します。最頻値が近ければ両者は似たような数値になることが多いですが、例外もあります。
クラスの中で飛びぬけて優秀な人がいたり、学力が圧倒的に劣る生徒がいる場合、平均値はかなり変動する可能性があります。
多くの生徒が60点から70点くらいの中、100点を取る生徒がいたり、0点を取ってしまう生徒がいるケースも考えられます。
この場合、平均値は上下してしまいますが、中央値はそこまで変化しません。
クラスの人数が少ない場合、一人優秀な生徒がいるだけで平均値は一気に上がってしまうことがあり、クラス全体のが学力が高いと勘違いしてしまうことがあります。
その点中央値は真ん中の数値を探すので飛びぬけて優秀な人がいても大きな影響を受けません。
人数が少ないクラスの場合は平均値だけでクラス全体の学力を判断するのではなく、一緒に中央値を導き出し、両者の数値を見比べる必要があります。
クラスの人数が100人を超える場合、学校全体の学力を導き出す場合は平均値を重視しても良いです。
データ分析をする場合はデータの数や質に応じて平均値と中央値を使い分けたり、時には両者を比較する必要もあります。
平均だけのデータを信用するのは危険ですし、最頻値や中央値を確認して信憑性や正確性を判断することも大事です。
バランス良く分布している数値であれば平均値だけでも問題ないですが、バランスが悪いデータの場合は平均値だけでは不十分です。