見出し画像

データの分析・数学I 統計って大事

現在、高校の数学Iでは、『データの分析』という項目があり、統計の基礎を学べる。2012年から教科書に採用されているようです。最近まで知らなかったし、現役の時は習った記憶がない…統計関連は品質管理でも重要だし、高校で習っていても損はない。統計学はデータが重要な意味を持つ現代においては、必須で当たり前になっている。

平均値だけじゃなくて、標準偏差とかヒストグラムなど分布、ばらつき を把握する大切さを本の引用で紹介しておきます!


平均値だけ比較しても、データの分布を見ると実は対して差が無いってことがあるので、平均値だけを信用するなという感じです。
男女で数学力に本当に差があるのか?
アメリカ人とメキシコ人において、アメリカ人の方がみんな所得が多いと言えるのか?を考えながら読んでください。

引用文献↓
『ファクトフルネス』
ハンス・ロスリング著

平均の比較 と分布

これから平均について手厳しいコメントをさせてもらう。念のために言っておくが、わたしは平均が大好きだ。情報を素早く伝えられる上に、役立つヒントを得られることが多い。平均を使いこなさないと現代社会はうまく回らないし、本書の議論も、たくさんの平均値を基に成り立っている。  

しかし、情報を単純化すると見えなくなるものも多い。平均値というひとつの数字を用いた場合、分布が隠れてしまう(分布とは、各数値の出現頻度を示すもので、後に詳しく説明する)。  

例をあげよう。  次の2つのグラフはそれぞれまったく違うデータを表している。

画像1


左のグラフは、アメリカの大学入試(SAT)の数学科目における、男女それぞれの平均点を表している。男女の平均点には分断があるのがわかるだろう。データは1965年から毎年記録されている。右のグラフは、メキシコ国民とアメリカ国民のそれぞれの平均所得と、そのあいだにある分断を表している。  両方のグラフを見ると、分断が非常に大きいと感じないだろうか。

男性と女性、アメリカとメキシコ。
このグラフだけ見れば、男性は女性より数学が得意で、アメリカ国民はメキシコ国民より所得が多いように思える。これはある意味正しい。数字に偽りはないのだから。  
でも、「ある意味正しい」とはどういうことだろうか。このグラフから導ける具体的な結論はなんだろう。すべての男性は、どんな女性よりも数学が得意と言えるだろうか。すべてのアメリカ人は、どんなメキシコ人よりも金持ちだと言えるだろうか。  
手始めに、縦軸の目盛を変えてみた。それが次の2つのグラフだ。

画像2


同じ数字を使っているのに、データがまったく違う印象になった。大きな分断がほとんど消えてしまったかのように見える。  

次に、同じデータをさらに別の視点で見てみよう。
年次平均を見るのではなく、あるひとつの年に注目し、その年の数学の点数や所得の分布をグラフにしてみる。すると数字の裏にある現実が見えてくる。
 こうすれば、平均というひとつの数字の背後にいる大勢の人の存在に気づけるようになる。

画像3

グラフをよく見てみると、男性の点数のグラフと、女性の点数のグラフはほとんど重なっている。
同じ点数の男性と女性でペアを組むと、余る人がほとんどいないくらいだ。
一方メキシコとアメリカの所得のグラフは、重なりはあるものの一部でしかない。
 こうやってデータを見ることではっきりと言えるのは、男性と女性も、アメリカ国民とメキシコ国民も、それぞれ分断されてはいないということだ。2つのグループには重なりがある。
 もちろん、「分断」という言葉が現実を表すのに相応しい場合もある。アパルトヘイト時代の南アフリカでは、黒人と白人はまったく違う暮らしをしていた。両者のあいだには大きな分断があり、重なりはほとんど無かった。このような場合なら、分断という言葉を使っても構わない。
 しかし、アパルトヘイトは極めて特殊な出来事だ。ほとんどの場合において、分断という言葉は誤解を生む誇張表現だ。平均だけを見ると分断がありそうでも、実際に2つのグループが分断されていることは少ない。

平均の一歩先にある「分布」に注目し、ひとくくりにされた数字よりも一人ひとりの数字を見ることで、より正確な全体像をつかむことができる。分断されているように見えても、重なりがあることは意外と多い。

よろしければ、サポート(入塾)お願いします!サポート代での月謝支払いなんでどうでしょう?