![見出し画像](https://assets.st-note.com/production/uploads/images/142196186/rectangle_large_type_2_1a0f73d0e8f2aa30e389af45d23258a7.jpeg?width=800)
地方帝国大の合格者の偏差値分布(大学の合格最下位学力の統計分析⑥)
趣味の統計分析シリーズです。少し前に模試判定から合格者を推定するモデルを作りました。
今回はそのモデルを使って、地方帝国大(地帝)の合格者の偏差値分布を推定してみます。これによって、共通テストリサーチから地帝の東大合格レベルの推定結果の検証も行います。
模試判定を使った合格者推定モデルの詳細、地帝の東大合格レベルの推定(共通テストリサーチモデル)は過去の記事を参照ください。
なお、コメントで指摘いただいたのですが、このモデルは模試の判定ホルダー全員がその大学を受験するという前提にあり、「D判定なので断念」とか「A判定なので一つ上を目指す」とかの模試〜受験のフローが加味されていないことがわかりました。ただ、そこまでやるとモデルが複雑になりすぎるので、当面は現在のモデルを分析に使うことにします。
0 まとめ
地方帝国大の合格者の平均偏差値は55.4、中央値は56.0。医学部医学科が上方に分布を伸ばしているが、47.3〜62.7に全体の半分が入る。
模試判定を用いた合格者推定モデルと共通テストリサーチからの合格者推定モデルの間には、有意な差があるとは言えない(t検定・有意水準5%・両側)。つまり、同一の母集団に対する推定として扱えて、推定値の違いは方法の違いによるブレ(誤差)として扱える。
2つのモデルの平均を取ると、地方帝国大の合格者のうち東大に合格できるレベルの人数は、定員に対して以下の割合と推定される
学部・学科の拘りがない場合 15.0% ※東大文三限定
学部・学科に拘りがある場合(文系) 13.4%
学部・学科に拘りがある場合(理系) 5.7%
学部・学科に拘りがある場合(全体) 13.4%
1 受験者の偏差値分布の基本モデルの作成
駿台全国模試では、A判定(合格可能性80%)、B判定(60%)、C判定(40%)、D反映(40%未満)の4段階の判定を設定しています。模試受験者に提供されるのは、大学・学部・学科別のB判定一覧表のみで、A判定やC判定の偏差値は志望大学判定を登録したところだけです。
ただ、子供の成績表やブログに投稿されている成績表を見ると、東大理一・理二はA〜BもB〜Cも偏差値5の幅で設定されていました。一方、東工大などは偏差値3〜4の幅となっています。何らかの理由でボーダー偏差値(B判定)が高いほど、分布の幅を大きく設定しているようです。
この傾向も踏まえて、B判定偏差値に応じて、大学・学部・学科の受験者の偏差値分布をモデル化したのがこの表です。A:B:Cは1:2:4(等比2)で、倍率2.8倍(国公立大学平均)で作っています。数字(%)は定員に対する比率です。
![](https://assets.st-note.com/img/1716901586853-l0zE9ernQ9.jpg?width=800)
A判定の幅は上限を5にして変動させ、逆ににD判定は5で固定させています。国公立大は輪切りの効果で上は抜けるけど、浪人覚悟でチャレンジする層は変わらないという前提です。
上下の分布幅は、高い偏差値ほど幅が広くなるように、サンプルも見ながら設定しています。その上で、判定ごとに推定される受験者数(定員比率)を按分しています。
このモデルの場合、A判定:B判定:C判定:D判定の分布は、20%:40%:80%:140%となります。いい感じの分布です。
これを判定ごとに按分するので、左端のB判定偏差値53の大学・学部・学科では、A判定は偏差値1の幅に20%÷3で7%ずつ分布します。一方で、右端の偏差値65では、A判定は偏差値1の幅に20%÷4%しか分布しません。ただし、幅が5あるので、上限は偏差値53よりも上に伸びています。
これは受験者の分布なので、判定ごとの合格可能性を乗算すれば、合格者数が推定できます。これまで同様にD判定の合格可能性は20%で設定します。
2. 地帝合格者の分布推定
それでは、地帝の受験者の分布から合格者の分布を推定します。偏差値63以上は対象の大学・学部・学科が少なく、倍率調べるのが容易なので、個別の倍率を設定しています。それ以外は、国公立大平均の2.8倍を使っています。
その受験者分布に合格可能性を乗算すると、地帝合格者の偏差値の分布はこのようになります。偏差値は駿台全国模試(2023年7月調査)です。
![](https://assets.st-note.com/img/1716935730213-OPUv2Yqkmi.jpg?width=800)
このモデルから推定される地帝合格者の平均偏差値は55.4で、中央値は56.0でした。47.3〜62.7に全体の半分が入っています。医学部医学科があるので、上位層もいるのですが、まばらであることがわかります。
3. 地帝合格者の東大合格レベル人数の検証
ここから地帝合格者が東大を受験したらどうなるかのシミュレーションを行います。まずは、学部学科に拘りがない場合とある場合の2パターンの推定です。
①学部学科に拘りがない場合
この場合、全ての地帝合格者(10,123人)が東大の最下位合格者がいる文三を受験します。定員オーバーとか1次試験での足きりとかは無視して、東大文三に合格できるレベルにあるのが何人かを計算します。
先に推定した地帝合格者の偏差値分布を、東大文三の判定別に集計すると、表の左のようになります。この推定モデルではD判定は偏差値幅5でカットしているので、推定外で合格可能性0%の受験者も存在します。
![](https://assets.st-note.com/img/1716908834800-JXDDL9oQuQ.jpg)
A判定とB判定がほぼいないのですが、D判定が大量に存在することがわかります。地帝合格者の中央値が56.0でしたので、上半分がD判定以上という感じです。この合計10,123名が東大文三を受験する場合、それぞれの判定の合格可能性を乗算して計算すると、合格レベルにあるのは1,371名となります。
学部学科に拘らなければ、地帝大の定員に対して13.5%が東大(文三)に合格できる学力があることがわかりました。
②学部・学科に拘りある場合
この場合は、学問の系列ごとにそれに近い東大の科類を受験します。6つの科類でそれぞれ集計して、一覧にするとこうなります。
![](https://assets.st-note.com/img/1716909214362-XuWSfaE0KL.jpg?width=800)
模試判定の推定モデルで算定すると、地帝の法学系で文一に合格するのが105名(定員比14.4%)です。同様に文二:10.8%、文三:14.4%で文系平均で13.4%が東大の各科類に合格できる計算になりました。
一方、理系は全体的にハードルが高めです。理一で6.5%、理二で8.1%、理三で13.1%でした。理系平均は7.4%です。
全科類の平均は9.2%なので、「地帝合格者が学部・学科に拘って東大を受験すると、合格できるのは9.2%(11人に1人)」となります。
③検証
模試判定からの推定モデルで計算したのが上記数字です。共通テストリサーチの最下位順位からの推定は、以前に調査して算定済みです。ここ2つを並べると、こんな感じになります。
![](https://assets.st-note.com/img/1716909636614-VkKXjN3p0O.jpg?width=800)
白抜きの6科類を見ると全般的に、共通テストリサーチからの最下位モデルよりも、模試判定の方が数字が大きくなってます。では、この2つの推定モデルに有意な差があるのか検証したい思います。
白抜きの部分について、共通テストリサーチ(上段=変数1)と模試判定(中断段=変数2)のデータに体して、t検定を行います。帰無仮説は「この2つの判定(変数1と2)の間に有意な差はない」です。有意水準5%です。
![](https://assets.st-note.com/img/1716909935283-TDaZm7SkPj.jpg)
tの絶対値が0.82に体して、両側検定の棄却域は2.23なので、帰無仮説は棄却できず、「共通テストリサーチからの推定と模試判定からの推定の間に、有意な差があるとは言えない」となります。
2つの変数に差があると言えないのであれば、推定した対象は同じ母集団であり、推定値の違いは推定方法のブレ(標本の差)と言えます。同じ母集団の標本のため、2つの平均を取れば、真の値に近い数字になるはずです。
この考え方の下、地帝の東大合格レベルの人数(定員比)を2つのモデルの平均値として計算すると、このような数字となりました。
学部・学科の拘りがない場合 15%
学部・学科に拘りがある場合(文系) 13.4%
学部・学科に拘りがある場合(理系) 5.7%
学部・学科に拘りがある場合(全体) 13.4%
4. 最後に
新たにB判定偏差値別に合格者の偏差値分布が算定できるようになりました。次回は東大内の科類の違いを、いくつかの手法を組み合わせて、分析する予定です。
この記事が気に入ったらサポートをしてみませんか?