見出し画像

東大合格は1990年代より難しくなったのか? 〜母集団変化の偏差値影響の定量分析〜

子供の高校受験を考える時期になり、近くの高校の進学実績を見る流れで、最近の東京大学の難易度が目に付きました。そこには、理科一類の河合塾のボーダー偏差値(C判定)が67.5と書いてありました。あれっ、私が入試を受けた頃の東大理一のボーダーはもう少し低かったはず・・・。

記憶を確かめるべく、高校のころの荷物を探してみると、1993年の河合塾の全統模試の成績表が見つかりました。やはり25年前くらいの東大理一のボーダー偏差値は65.0でした。

この25年間で、東大理一のボーダー偏差値は65.0から67.5に上昇していたのです。そうなると次の疑問が生まれます。「ということは、東大合格は1990年代より難しくなったのか?」。

この疑問に対しては、ネットで少し調べてみたのですが、

・京大の人気が落ちて、東大一極集中になり難化した
・18歳人口の減少で、相対的に易化した
・東大のボーダー付近の学力は低下している(予備校講師)
・成績優秀者が国立医学部に流れ、東大は入りやすくなっている

などの定性的なコメントが書かれたサイトは見つかりました。でも、東大合格の難易度変化を定量分析しているサイトは見つかりません。そこで、自分で簡単な統計モデルを作って、私の疑問を検証してみました。

以降は、自分の疑問に対して、自分の納得のために作ったモデルと考察です。ただ、ネットを見る限りでは、私と同じような疑問を持っている方もいるようなので、公開してみます(noteデビューです)。

前提条件や計算方法も書くので長くなりますが、それらに興味ない人は、最後の方の推定結果の考察に飛んでもらったらいいと思います。先に結論を書くと、「過去25年間の東大のボーダー偏差値上昇は母集団変化による上昇影響が大半であり、実質的には変化なし」です。

ーーーーーーーーーー


1. 知っておいていただきたいこと

私は統計のプロでなく、大学でも2コマしか統計の授業は履修してません。また、厳密にモデルを作ることが目的でなく、自分の疑問への検証(納得)が目的なので、Excelで概算の計算です。しかも、自分だけでやっているので、モデル設計のミスとかあるかもしれません。そのレベルのモデルとして眺めてください。

2.統計モデルの前提条件

① 基準年に取り上げた年度はその年代を代表する数値である
今回は、私が大学入試を受けた年度である1994年を基準に、四半世紀後(25年後)の2019年の比較としています。本来なら、1991-1995年の平均と2016-2020年の平均の比などにすべきかもしれませんが、まずは点での比較としています。

② 18歳人口の絶対的な学力は全体として変化していない
国際的比較で日本の子供の学力が低下しているとか、ゆとり教育の弊害の話などを聞くことがあります。また、受験テクニックの普及や子供の貧富の拡大で学力差が開いているような印象もあります。ただ、それらを反映させるとモデルが複雑化するので、時代が変わっても絶対的な学力は変化なし、としました。

③ 18歳人口を母集団とした場合、その中での相対的な学力は正規分布する
架空のテスト(100点満点)を18歳人口全員が受験すると、平均点が50点、標準偏差10.0の正規分布になると仮定しています。つまり、この架空のテストの点数は、18歳人口を母集団とした偏差値と一致します。この偏差値を「全体偏差値」と呼びます。なお、②の前提があるので、1994年の全体偏差値が示す絶対学力と2019年の全体偏差値が示す絶対学力は一致し、年度間の変換が可能になります。

④ 全体偏差値の上位から大学進学者の半数の人数までは全員が大学進学する
仮に18歳人口が100万人、大学進学者が50万人の場合、大学進学者の半数は25万人となります。この場合、100万人の全体偏差値の上位25万人は全員が大学に進学し、下位75万人が残りの大学進学者、短大進学者、専門学校進学者、高専学生、就職などになるというモデルにしています。短大生や高専学生などにも優秀者はいると思うのですが、簡素化のためにこうしています。

⑤ 大学進学者の中央値の全体偏差値を軸として、大学進学者の全体偏差値の分布は左右対称の分布とする
本当は大学進学者の分布も正規分布にするのがよいと思いますが、モデルを作るのが大変なので、計算の簡素化のためにこのようにしました。この場合、中央値=平均値となります。図にするとこんな感じです。

図1

⑥ 大学進学者全体を母集団とした場合、その中での相対的な偏差値は、河合塾の全統記述模試の偏差値に一致する
大学進学者を母集団とした偏差値を「進学者偏差値」と呼び、進学者偏差値=河合塾の全統記述模試の偏差値としています。大学進学者の成績分布を代替する良い指標が他にないので、河合塾の全統記述模試を採用しました。年度比較のために、その年度を付記して標記し、1994年のものは「1994進学者偏差値」、2019年のものは「2019進学者偏差値」という標記をします。

3. 投入データと統計モデルの計算方法

① 投入データ
◆ 1994年
18歳人口:186万人、大学進学者数:56万人(大学進学率30%)
◆2019年
18歳人口:117万人、大学進学者数:63万人(大学進学率54%)
(出典)文部科学省
https://www.mext.go.jp/content/20201126-mxt_daigakuc02-000011142_9.pdf

② 統計モデルの計算方法(Excelでやってます)
・正規分布関数を用いて全体偏差値0.1刻みで18歳人口の度数分布表を、年度ごとに15.0〜84.9の範囲で作成する。
・年度ごとの大学進学者の中央値を算出し、18歳人口の度数分布表を中央値で折り返して、大学進学者の度数分布表を作成する(前提④⑤)。
・年度ごとの大学進学者の度数分布表から、その年度の大学進学者の標準偏差を算定する。
・算出した平均値(=中央値)と標準偏差を用いて、年度ごとの進学者偏差値を計算し、年度間の換算も行う。

<数式>
1994進学者偏差値=(全体偏差値―1994平均値)÷ 1994標準偏差 ×10 + 50
2019進学者偏差値=(全体偏差値―2019平均値)÷ 2019標準偏差 ×10 + 50

2019進学者偏差値=(1994進学者偏差値−50)× 1994標準偏差 ÷ 2019標準偏差  + (1994平均値−2019平均値)×10 ÷ 2019標準偏差 + 50

4. 統計モデルの推定結果

① 主な数値
各年度の大学進学者の全体偏差値(絶対学力)の平均値と標準偏差は次の表の数値になりました。誤差は全体偏差値15.0〜84.9の幅で計算したことと、中央値の折り返しを0.1幅で行ったことにより発生したものです。過去25年間で大学進学者の学力(全体偏差値の平均値)は下がり、上下格差(標準偏差)が大きくなったことがわかります。

画像2

② 分布
上記の数値を使って18歳人口と大学進学者の分布を作ると、この図になります。18歳人口が減る中で大学進学者数が増えたことが、大学進学者の分布が左にシフトして扁平に伸びていることで表現されています(青線→オレンジ線)。

図2


③ 進学者偏差値の換算
進学者偏差値の換算式(3−②−6)に、算出した平均値と標準偏差を入れるとこのようになります。

2019進学者偏差値= 1994進学者偏差値 × 0.86  + 12.2
1994進学者偏差値= 2019進学者偏差値 × 1.16  ー 14.2

これを元に、年度間の偏差値の換算表を作ったものが次の表です。年度間の進学者偏差値の差は、高偏差値に行くにつれて差は縮小し、低偏差値に行くにつれて拡大します。これは難関校ほど母集団変化の影響が少なく、中堅校以下は母集団変化の影響を大きく受けていることを意味しています。

画像5

5. 推定結果の考察

1994進学者偏差値65.0は2019進学者偏差値に換算すると68.1となりました。東大理一の河合塾ボーダー偏差値は、1994年から2019年の25年間で65.0から67.5に2.5上昇していますが、上記のように母集団変化によって+3.1の増加があると考えられるため、実質的には進学者偏差値で▲0.6の減少=易化となります。

また、全体偏差値に換算すると、1994進学者偏差値65.0は全体偏差値70.4となり、2019進学者偏差値67.5は全体偏差値69.9となるため、全体偏差値では▲0.5の減少=易化となります。

図3

この偏差値▲0.5-0.6の易化要因には、相対的な定員の上昇(※)や成績優秀者の医学部シフトなどがあると考えられます。ただし、この程度の減少幅は統計モデルよる誤差がかなり含まれており、これをもって、易化したと断言することも難しいです。

また、そもそも河合塾のボーダー設定は偏差値2.5の幅であり、▲0.5〜0.6の変化はこの幅の中で吸収されてしまいます。よって、「東大合格の実質的な難易度は、1990年代より多少は易しくなった可能性があるが、ほぼ変化なし」というのが私の考察結果です。

※相対的な定員の上昇: 東大定員÷18歳人口を計算すると、1994年は3,586人/186万人=0.19%、2019年は3,060人/117万人=0.26%となり、18歳人口に対する定員の割合は上昇している

ーーーーーーーーーー

以上が、作った統計モデルとその分析になります。東大理一の河合塾のボーダー偏差値は65.0から67.5に上昇したけど、「過去25年の東大のボーダー偏差値上昇は母集団変化による上昇影響が大半であり、実質的には変化なし」という結論になりました。

東大理三も70.0から72.5に、東大理二は62.5から67.5に上昇していますが、この上昇の大半も母集団変化の要因で説明できます。東大文系は過去データがないのでわかりませんが、同じ傾向だろうと思います。

一方、国立医学部が難化したという話もありますが、このモデルだと偏差値が低いほど母集団変動の影響が大きく出るので、ボーダー偏差値の+2.5〜5.0の上昇なら実質はほぼ変化なしだと思います

逆に25年前と比較してボーダー偏差値が上昇していない大学は実質的には1ランク(偏差値2.5)以上易しくなってます。ボーダー偏差値が下がっている大学(中堅私大や地方国立?)は見た目以上にかなり易しくなっている、ということになります。

もちろん、前提条件を変えると結果は変わります。学術論文なら前提条件やモデルの妥当性が議論になるのだと思いますが、個人の趣味の分析なので、こんなくらいで十分かなと思います。もしも、この記事に反応があったら、続きの考察やモデル見直しを行うかもしれませんが、ひとまずの私なりの考察と結論です。

この記事が気に入ったらサポートをしてみませんか?