見出し画像

初期研修プログラムの倍率を考えてみた【無料】


 マッチング協議会の資料では、フルマッチの病院で実際に何人が選考で落ちたのかを知ることは出来ません。病院の倍率はマイナビ等では中間発表の第一希望者数で語られていて、多くの学生も第一希望者数だけを見ていると思います。確かにアンマッチする病院でも3倍近い倍率となる総倍率より、1倍以上ならフルマッチが保証される第一希望倍率の方が直感的です。

 ただ実際は第一希望だから優先される訳ではなく、あくまで希望者全体の中で比較されることを考えると、どうしても総倍率を無視することに違和感がありました。もちろん総倍率が高くともアンマッチする病院はあるので、総倍率だけでも駄目です。

 そしてなんとなくの人気とか不人気ではなく具体的な倍率が予測出来ることで、面接での戦略が変わると思います。例えば倍率が1.5倍だと分かっていて、自分が上位2/3にいるような経歴なら、嘘をついてまで盛る方がリスキーです。一方で地元でなかったり留年経験があるなど下位1/3だと予想される場合は、少し踏み込んだアピールが必要でしょう。

 私はマッチング協議会の資料を読み込む中で、なんとか公表されている情報から実質的な倍率を推定する方法がないかと考えてみました。結論から書いてしまうと、中間発表の第一希望者数,最終的な希望順位登録者数、病院の定員から下記の式でそれっぽい倍率を求めることが出来ます。

【選考に参加する人数】
第一希望者数
× 3 / 4 + 希望順位登録者数 / 4

上の式より倍率は
(第一希望者数
× 3 / 4 + 希望順位登録者数 / 4 )/ 定員

以下どうしてこの式にたどり着いたのかダラダラ解説します。
この式がいずれ後世に語り継がれたら嬉しいです笑


計算に使うデータ

 2020年度のマッチング協議会の資料を使います。

画像5
画像6


推定の理屈

 あるA病院について、中間発表の第一希望者数をa,最終的な希望順位登録者数をbとします。

画像3

  まず、希望順位登録者b人のうち、第一希望~第九希望以降でどのような分布になっているか考えてみます。

 第一希望はマッチングに参加する全員が登録しているので、登録者は9626人です。第二希望を登録している人は全体から1個しか登録していない人を引けばいいので、9626-1768=7863人になります。同様にそれぞれの順位の登録者数を求め、さらにその合計に対し各順位の登録者が占める割合を求めたのが下の表になります。例えば表の29.6%は100*(9626/32538)です。
 また後で使うので、2位以下で登録している人の合計に対する割合も求めておきました(※)。

画像4

 この推定のポイントですが、A病院を第二希望にしている24.2%の人は、第一希望の病院にマッチした場合、A病院の選考に絡まなくなります。第三希望以降にしている人も、より上位希望の病院にマッチすれば選考に絡みません。

 実際の選考参加者を見積るため、第二希望を出している人が第一希望の病院にマッチする確率(P2)を考えてみます。第一希望にマッチしたのは6309人、そのうち1プログラムしか登録していない人は1559人いるので、第二希望以降も出したのに第一希望にマッチしたのは4750人です。よってP2は上の表の第2希望登録者と合わせて、4750/7863(0.604)になります。逆にマッチせず、A病院の選考に参加する確率は1-0.604(≒0.4)です。

 つまりA病院を登録した人が100人いた時、第二希望で出している人は24人ですが、このうち実際に選考に参加するのは24*0.4=9.6人になります。
 この第n希望で登録した人が第n-1希望までにマッチする確率Pnは、下図のようになります。

画像5

 よって「A病院を登録した人の希望順位分布が全体と同じ」なら、実際に選考に参加するのは希望順位登録者数bを使って次のように表せます。

b×0.296(第一希望者)+b×0.24×0.396(第二希望者)+(第三希望者)+…
=b×(0.296+0.24×0.396+……)
=b×0.474

 しかし結論から言うと、これは思いの外精度が出ません。おそらく「A病院を登録した人の希望順位分布が、全体の希望順位の分布と同じ」という前提に問題があります。

 そこで上の式を見て頂きたいのですが、62%(0.296/0.474) と第一希望者が選考参加者の過半数を占めることが分かると思います。そこで影響が大きい第一希望者は中間発表の第一希望者数aを使って計算します。
 第一希望を除いた分布はすでにお示しした通りです(※)。これを第二希望以降でA病院を登録しているb-a人に適応したのが下の式です

a(第一希望者数)+(b-a)×0.343×0.396(第二希望者数)+(b-a)×0.257×0.255(第三希望者)+ ……
=a+(b-a)×(0.343×0.396+0.257×0.255+……)
=a+(b-a)×0.253797137
≒a+(b-a)/4
=3a/4+b/4

これが下記の冒頭の式になります。

【選考に参加する人数】
第一希望者数
× 3 / 4 + 希望順位登録者数 / 4

倍率は
(第一希望者数
× 3 / 4 + 希望順位登録者数 / 4 )/ 定員


実際に試してみた

 2020年度のデータで適当な病院に当てはめてみると……(あまり恣意的にならないように、とりあえず一覧表で上の方にある北海道の病院+α)

①市立函館病院 登録者21人 第一希望者11人
推定数:11*3/4+21/4=13.5  結果 定員12人フルマッチ
②札幌東徳洲会病院 登録者16人 第一希望者7人
推定数:7*3/4+16/4=9.25  結果 定員11人中10人マッチ
③順天堂附属練馬病院 小児科プログラム 登録者32人 第一希望者1人
推定数:1*3/4+32/4=8.75  結果 定員2人中1人マッチ  

 フルマッチすると実際何人で争ったかは分からないのですが、①で第一希望者だけでみて「定員内だから絶対入れる」というよりは、「登録者が21人もいるし14人中12人採用で2人落ちた」の方が妥当な推測だと思います。市立函館は去年もフルマッチですし。②の札幌東徳洲はかなりいい値が推定値として出ています。
 自分で使った感想としては、第一希望者だけで考えるよりだいぶ正確な倍率予想が出来ると思います。ただ第二希望以降は全体の分布を前提にしているので、分布が特異的だと成り立ちません。たとえば3割いるはずの第一希望者が極端に少ない病院(多くは大学病院)では、第二希望以降の分布も歪んでいるようで、③のように大幅にズレます。

 どうでしょうか。個人的には面倒な計算をした割に綺麗な式になり、なかなか興味深い結果になったと思います。
 すぐ終わるかと思ったら3日位かかったので、面白い話だと感じた方は一杯奢る気持ちで課金してくれると嬉しいです。有料部分で追加の情報はありませんが、おまけで2020年度の全研修プログラム分計算し、倍率別に色分けしたPDFとexcelファイルを配布します。式の信用度も分かると思います。

※2022年度版も追加しました。これに伴って2020年度版は無料配布します。
 

全研修プログラム分計算してみた

赤:倍率3倍以上(124プログラム)
オレンジ:倍率2倍以上、3倍未満(205プログラム)
緑:倍率1倍以上、2倍未満(473プログラム)

PDF

エクセル 


2022年度版

ここから先は

7字 / 2ファイル

¥ 300

この記事が気に入ったらサポートをしてみませんか?