![見出し画像](https://assets.st-note.com/production/uploads/images/141764872/rectangle_large_type_2_0a8d0e52d4f3770b7de465e6de03abbb.jpeg?width=800)
東大入試をもう一度やったら半数が入れ替わるのか?(大学の合格最下位学力の統計分析④)
趣味の統計分析で、最近は共通テストリサーチのデータを使って、大学の合格最下位学力の推定を行っています。
これまでの分析結果を見ると、理三の合格最下位の推定は、共通テストリサーチのデータを用いた分析では精度があまり高くなさそうでした。今後、東大の科類の比較分析を行う予定ですが、その際には共通テストリサーチだけでなく、いくつかの合格者数の推定方法を組み合わせる必要がありそうです。
今回は、別の推定方法の一つとして、模試の判定を使って合格者数の推定モデルを作ります。あわせて、その過程で、表題の「東大入試をもう一度やったら半数が入れ替わる」という言説の検証も行ってみます。
0. まとめ
倍率が2.5倍の大学(東大理一など)で、受験者におけるA判定:B判定:C判定:D判定の比率が1:2:4:4であれば、合格者の約半分がA判定とB判定、残り半分がC判定とD判定となる。
A判定:B判定:C判定:D判定の比率が「1:2:4:残り」であれば、東大合格者にもう一度入試を行ったら入れ替わる比率は、理一では51%、文一・文二・文三では58%、理二・理三では61%となる。
「東大合格者にもう一度入試を行ったら半数が入れ替わる」というのは、概ね正しいと言える。
一般化すると、再合格率は、A判定:B判定:C判定の比率と倍率の関数であり、「大学入試に限らず、高校入試や中学入試でも、倍率2.8倍を超えると、合格者にもう一度入試を行ったら半数以上が入れ替わる(再合格率50%未満)」と言える。
1 駿台全国模試の判定での合格者数推定ロジック
今回は駿台全国模試の判定の定義で分析します。駿台全国模試では、大学・学部・学科ごとに偏差値1単位でA判定(合格可能性80%)、B判定(60%)、C判定(40%)の判定偏差値を設定しており、C判定未満はD判定(40%未満)となります。
この時、A判定、B判定、C判定の比率は一定ではありません。駿台全国模試の成績表のサンプルを調べると、A:B:Cの比率は、東大理一(3回分)では1:2:4でした。東工大・物理工(3回分)も同じ1:2:4でしたが、東大理二(2回分)は1:2:3でした。
このように、A:B:Cの比率は大学によって変わる変数のようです。ただ、あまり変数を増やすと、分析が複雑化します。そのため、今回、判定を使った合格者数推定ロジックを作るにあたり、受験者数の多い東大理一をサンプルとして、A:B:Cの比率は1:2:4の定数として一旦は設定します。
D判定は残差として扱います。合格可能性は20%とし、合格者が100%になるよう残りの受験者全てをD判定とします。この場合、A:B:Cに対するDの比率は、その大学・学部・学科の倍率に依存します。
例えば、東大理一の2次試験倍率の近似値として倍率2.5倍で計算すると、A:B:Cが1:2:4、残りがD判定なので、受験者のA:B:C:D=23%:45%:91%:91%です。
これに合格可能性を乗算すると、合格者のA:B:C:D=18%:27%:36%:18%となります。東大理一合格者の約半数(45%)はA判定とB判定、残り半数(55%)がC判定とD判定であり、A判定であれば上位2割以内に入っているようです。
これが駿台全国模試の判定定義を用いた合格者数の推定モデルとなります。
ただし、駿台全国模試の判定定義ではA判定が合格可能性80%、D判定が合格可能性20%のため、このモデルが適用できるのは倍率1.25倍(125%)〜5.0倍(500%)までです。今のモデルでは、倍率1.25倍の時は受験者全員がA判定、倍率5.0倍の時は受験者全員がD判定となります。
実際にはそんなことないので、この補正は次回に検討することにして、今回はこの推定モデルで分析を進めます。
2. 東大合格者はどれくらい入れ変わるのか?
「東大合格者にもう一度入試をやったら半数が入れ替わる」というのは、ネットの記事を見ると、開成高校の先生や東大の入試委員会が言ったようです。この仮説に対して、上記の合格者推定ロジックで検証してみます。
倍率2.5倍でA:B:Cが1:2:4であれば、東大理一合格者の受験時の判定の比率は、A:B:C:D=18%:27%:36%:18%です。この東大理一合格者が東大理一の入試をもう一度受験する場合、再受験者のA:B:C:Dの比率も18%:27%:36%:18%となります。これに合格可能性を乗算すると、1回目の合格者(定員100%)に対する再合格者の比率は、15%:16%:15%:4%で合計49%です。
![](https://assets.st-note.com/img/1716602279370-HG1CCslXoP.jpg?width=800)
最初の合格者に対する再受験の合格者は49%なので、2人に1人しか合格できていません。逆に言えば、東大理一受験をもう一度行うと、2人に1人が不合格で入れ替わっていることになります。
他の科類もシミュレーションしてみます。まず、文一・文二・文三です。
![](https://assets.st-note.com/img/1716602292209-DNWqL3vgtq.jpg?width=800)
文一・文二・文三の倍率は約3.0倍です。この推定モデルでは、倍率が増えると残差のD判定が増えるので、もう一度入試を行った時の再合格の比率は43%に低下します。文一・文二・文三では、合格者の57%が入れ替わることになります。
次に理二と理三です。
![](https://assets.st-note.com/img/1716602309084-5dO2DMPXi9.jpg?width=800)
理二・理三は倍率が約3.5倍なので、次の表のように、D判定の受験者が大半になります。そのため、理二・理三では再合格の比率は37%と4割を切ってしまい、合格者の6割強が入れ替わることになります。実際にはD判定にここまで偏ることはなく、C判定とD判定を行き来している受験者のチャレンジが多いのだろうと思います。
これらは、駿台全国模試の判定から簡易的に作った推定モデルですが、「東大入試をもう一度やったら半数が入れ替わる」というのは、概ね正しそうだということがわかりました。
3. 推定モデルの一般化
この推定ロジックでは、A:B:Cの比率と倍率で再合格率を計算しています。そのため、A:B:Cの比率が同じであれば、どこの大学の入試であっても、もっと言うと、高校入試でも中学入試でも、倍率を変数として再合格の比率は決まると言えます。
例えば、A:B:Cの比率が1:2:4で、倍率が2.5倍ならどこの大学でも再合格率は49%となります。そして、それ以上の倍率になると再合格比率は低下していきます。
ただし、A:B:C=1:2:4で推定できるのは、倍率2倍以上の場合です。2倍未満になるとD判定の人数がマイナスとなるため、適用できません。おそらく、2倍未満の場合は、A:B:Cの比率のギャップが小さくなるはずです。
再合格率の推定モデルをもう一段進化するために、A:B:Cの比率を等比級数とすることにします。乗数をmとおくと、A:B:C=a: m*a:m^2*aとなります。m=2.0の時が、A:B:C=100:200:400です。m=1.2の時はA:B:C=100:120:144となります。
このように再合格率は、等比級数の乗数mと受検倍率nの2変数の関数となり、mとnに応じてこの表のような数値を取ります。青枠のm=2.0が、これまで定数設定で分析してきた部分になります。
![](https://assets.st-note.com/img/1716605288386-GJu6CvQ9sO.jpg?width=800)
この表を見ると、280%(倍率2.8倍)を超えると、A:B:Cの比率(等比mの値)に関わらずに再合格率が50%を下回っています。このことから、「大学入試・高校入試・中学入試のいずれでも、倍率が2.8倍を超える場合、合格者に入試をもう一度やったら半数が入れ替わる」と考えられます。
なお、倍率2.8倍は国公立大学の平均倍率にちょうど一致しており、国公立大では「合格者に入試を行ったら半数が入れ替わる」というのは一般的な傾向のようです。
4. 最後に
模試の合格判定を用いた合格者数の推定モデルは、このように基本部分が作れました。せっかくモデルを作ったので、次回はこの推定モデルを使って、いくつかの命題について考察を行ってみます。具体的には次の命題です。
筑波大駒場中学の合格は運なのか?
都立高校受験でA判定なら合格率100%なのか?
医学部のボーダー偏差値はなぜ高いのか?
この記事が気に入ったらサポートをしてみませんか?