「もしも○○大の入学者が東大を受験したら、何人が合格するのか?」についての考察
趣味の統計分析で、共通テストリサーチのデータや駿台全国模試偏差値の判定を用いて、ある大学の入学者が東大を受験した時の合格者数の推定(以下、東大受験シミュレーション)をいくつか行なっています。あくまで前提を色々と置いた上でのシミュレーションですし、実際にそうした再受験を行った統計データはどこにもないはずなので、私の推定結果がどれくらいの精度があるのかもわかりません。
ただ、色々と分析したり、noteやXの投稿にコメントをもらう中で、そこそこ精度が高そうな推定と低そうな推定がありそうな気がしています。そこで、今回はこれまでに行ってきた東大受験シミュレーションの精度について考察してみます。ある種の「まとめ記事」です。
1. 推定モデル
東大受験シミュレーションでは、基本的には次の2つの推定方法を使っています。
①共通テストリサーチの最下位合格ラインからの推定(共通テストモデル)
共通テストリサーチに対象大学の受験生が全員(100%)登録しているという仮定の下、共通テストリサーチの得点上位からの累積人数=定員となる得点率を最下位合格ラインする推定方法です。別の大学で、この最下位合格ラインを超える得点率の人数が何人いるかを計算しています。
得点率は共通テストリサーチの直近5年間の平均で算定しています。科目数の違いや配点の違いは一定の誤差の範囲とわりきって、科目や配点の補正は行っていません。ただし、著しく異なる科目数・配点の大学・学部・学科は分析対象から除外しています。
②駿台全国模試の判定偏差値からの推定(模試判定モデル)
対象とする大学・学部・学科の駿台全国模試の判定偏差値から、受験者の偏差値分布を仮定して、倍率とA〜D判定の比率から合格者の偏差値分布を推定するモデルです。これを応用して、ある大学の合格者の偏差値分布に対して、東大の判定を当てはめて合格可能性を乗算することで、合格者数を推定しています。
なお、駿台全国模試は2次試験を想定していると考えられるため、シミュレーションを行う際の判定偏差値には科目数の補正(1科目減で偏差値+1)と文理の母集団差の補正(文系−1・理系+1)を入れています。科目補正は同じ受験生の得手不得手の構成差が総合偏差値に出る影響の補正であり、科目増減による勉強時間が変わることでの成績変動は加味していません。
2. 推定結果の精度に対する考察
まずは推定の基本的な考え方の整理です。
○○大学の東大受験シミュレーションは、「○○大学の入学直後に、もしも入学者全員が東大を受験したら、何人が合格するのか」というシミュレーションではありません。また、「○○大学の入学者が、もしも2次試験の出願直前に東大に受験校を変更していたら、何人が合格するのか」でもありません。
東大受験シミュレーションは共通テストや駿台模試の学力レベルから推定しているため、ある大学の入学者について、高3または浪人の夏から冬にかけての学力レベルと東大合格の学力レベルを比較して合否を推定しています。そのため、東大受験シミュレーションは詳しく表現すると、「ある学力レベル(駿台全国模試偏差値)があって○○大学に入学した受験生が、もしも高3夏くらい(できれば高2後半)に志望校を東大にして東大対策して東大を受験したら、何人が合格するのか」という前提でのシミュレーションです。現役と浪人を区別してないので、浪人後の東大合格も含まれます。
このような考え方の上で計算を行っているため、当該大学の受験科目や試験傾向などのブレが存在します。こうしたことから、これまでの東大受験シミュレーションには精度の高低が存在します。そこで、過去に行った東大受験シミュレーションについて、精度が高いと思われる順番で確からしさの考察を行っていきます。
①東大生がもう一度東大を受験する場合の再合格率は47〜49%
これは同じ学部学科(科類)を再受験するシミュレーションです。これは上記の考え方の例外で、「東大に入学した直後にもう一度東大を受験したら何人が合格するか?」という推定です。
そのため、東大と同じ学力レベル(判定偏差値)の母集団が、同じ受験科目(共テ+4教科5科目)で受験するシミュレーションとなるため、それなりに精度は高いと思います。
②東大理三に合格できる東大生は定員比15%(理三除くと11%)
東大理系の理三受験シミュレーションは同じ受験科目なので、①同様にそれなりに精度は高いはずです。一方、東大文系の理三受験シミュレーションでは、受験科目の変更があり、数IIIC追加と社会2科目が理科2科目に変わります。勉強負荷は数IIIC追加でやや増で、文理の得手不得手の影響も出るので、精度はやや落ちるはずです。
ただ、東大生は理系が多いし、文系も最上位層は青天井なので、文系と理系を平均すると、まあそれなりの精度の高さにあるだろうと思います。
③京大・一橋大・東工大(東科大)で東大に合格できるのは何人か
これは分析をまだ行っていませんが、学力レベル(判定偏差値)は近いので精度は悪くなさそうですが、京大理系以外は受験科目数の差が出るので、②よりは精度が低くなると思います。
④早慶で東大に合格できるのは定員比12%
私立大と国立大で共通テストの有無がある上に、受験科目数も差が広がります。しかし、早慶で東大に合格できる学力最上位層には、東大を受験したけど不合格で、併願先の早慶に進学した受験生が一定数存在すると考えられます。
こうしたことから、東大B判定以上の早慶進学者の東大受験シミュレーションは精度が高いはずです(①と同じくらい)。例えば、慶應文系からの東大受験シミュレーションでは、東大合格推定人数の約3割が東大B判定以上の入学者です。この部分は一定の精度の高さがあると考えられます。
一方、東大D判定以下で早慶に進学した層は、ちょっと厳しいかなとも思います。特に早慶文系の2〜3科目入試の学部学科での東大受験シミュレーションは、かなり精度が低いはずです。この東大D判定以下の早慶入学者が入学者分布のボリュームゾーンであることから、合格推定人数のかなりの部分を占めます。
これらの点を総合すると、早慶からの東大受験シミュレーションは精度が高い部分と低い部分が混在して、ほどほどの精度になっているのだと思います。
⑤国公立医医で東大に合格できるのは何人か
これもまだ分析してませんが、おそらく早慶の東大受験シミュレーションより、精度が低いと思います。旧帝や難関の医医はそこそこ精度のはずですが、中堅以下は共通テストの配点高いし、学力が輪切りで上位層が薄いと考えられます。また、全般的に駿台の判定偏差値に下駄があって、合格者平均学力は見た目より低いようです。
こうしたことから、国公立医医からの東大受験シミュレーションは、実際の東大受験生の残念組を含む早慶からの東大受験シミュレーションよりも、推定精度は下がると思います。
⑥地方帝国大で東大に合格できるのは6%
こちらも国立大学同士の受験シミュレーションですが、私立大の早慶からのシミュレーションより精度が低いと考えています。地帝大は国公立ですが、文系学部では2次試験が3科目の私立並みのところも多く、そうした学部学科の入学者には持ち偏差値以上に東大との距離があるはずです。
おそらく、地帝A判定・東大C判定の受験生なら、高2〜高3夏くらいまでに志望校を東大に変更して東大対策を行ったら、C判定の40%くらいは合格すると思います。ただ、自然体の勉強で地帝A判定はこれくらい合格しそうですが、必死に限界まで勉強しての地帝A判定は伸びしろが少ないので、もし志望校を東大に変更していても、東大には合格できないはずです。ましてや地帝B判定・東大D〜E判定は、数字上の可能性はあっても、かなり厳しいと思います。
そのため、地帝からの東大受験シミュレーションは、他の推定より精度が1段階落ちると考えています。
⑦東大理三に合格できる受験生は全国に625人(18歳人口の0.5%)
過去の東大受験シミュレーションで、最も精度が低いのがこの推定結果と考えています。これは、複数のシミュレーションを組み合わせた上で筆者の感覚的な数字操作を加えています。そのため、複数の誤差が組み合わさった上に、意図が入っているので、精度はかなり低いと思います。
ただ、100人単位で数字が変わって18歳人口比が0.4%や0.6%になっても、ほぼ誤差の範囲なので、まあ参考値としてはいいかなということで記事にしました。
3. まとめ
このように東大受験シミュレーションは精度がある程度ありそうな分析もあれば、かなり精度が低い分析も混じっています。いずれにしても、「もしも・・・」の世界の話なので細かい数字の大小は真に受けずに、「いくつかの前提をおいた推定方法で計算するとこれくらいになるのだなぁ」くらいで眺めてください。
今後も似たような分析を行ったら記事にしますので、興味あれば読んでいただければ嬉しいです。