データに何を含めるかという視点

データ(数値)を見る時、その値を見る前に絶対に注目すべきこと。それは定義を知ること。何をその数字に含めるか、含めないか。これによって、極端に言えば結果はいかようにも変わります。受け取る側はこれを意識しておくことが重要ですね。今日は1つ面白い記事を見つけたので紹介します。

【現役社員に聞く】三菱地所の平均年収1264万円はホント? 賃金水準をごまかす会社の裏ワザ

要するに、企業の平均給与を計算する時、誰を入れるか。きちんと定義がないから、企業が見せたいように数字を操作できる、という話です。

実は定義を変えることの問題は他にもあります。比較的最近起きたことで、悪質で印象に残ったのが、この事例です。

確かに就職率を定義する時、ある程度の難しさはあります。起業したり、家業を手伝ったりした場合、一時的だとわかっているバイトを就職に含めるか。これは分子に何を含めるかという話です。(実は分母にも注意が必要です。)

このような問題が起きるので、文科省は少なくとも普通の学校においては定義を定めています。しかしこのN高等学校はそれさえ無視してしまったのでした。


おまけ:
加えて知っておくべきは、給与や貯蓄を平均値で語る時は、注意が必要です。平均は重要な代表値ですが、中央値と大きく違う場合がある点です。

では、
    最頻値 < 中央値 < 平均
です。つまり、平均より少ない世帯は半分よりずっと多いということですね。数字を正確に把握し、社会の状況を理解するために、知っておきたいですね。