国試のトークン数📊

AIの実力を測るべく、先に医師国試、看護師国試、准看護師試験を解いてもらいました
GPT-3.5 Turbo、サンゴさん
サンゴさんの課金はトークン単位
問題に答えるのと一緒に、何トークン消費したかも教えてくれます

トークン

トークンは、テキストの最小単位
英語なら、英単語がほぼ1トークン
日本語なら、漢字1文字で複数のトークンになったりするそう
文字数と違って、少し意味に寄せた感じ

例えば、

 母体背景と胎児疾患の組合せで正しいのはどれか。3つ選べ。
a 風疹感染 ―――― 先天性心疾患
b 高齢妊娠 ―――― 13 trisomy
c 全身性エリテマトーデス ―――― 頭蓋内出血
d 妊娠高血圧症候群 ―――― 不整脈
e パルボウイルスB19感染 ―――― 貧血

(医師117A1)

文字数なら150文字ですが、トークン数だと214トークンになります

トークン数の方が、検査データとか記号とか、ごちゃごちゃ入った問題文を、うまいこと意味を汲んだ分量にしてくれないか
という期待を込めて、国試の特徴を見てみます

対象

前にGPT-3.5 Turbo、サンゴさんに解いてもらったやつ
医師国試、95回(2001年)〜117回(2023年)の23年分、11,140問
看護師国試、92回(2003年)〜112回(2023年)の21年分、5,250問
准看護師試験、平成26年度(2014年)〜令和4年度(2023年)の10年分、1,950問
トークン数はその時の副産物です

長文の連問は、やり取りを重ねて質問したので、トークン数が跳ね上がります
准看試験には連問や長文問題はありません

トークン数分布

まず、長文問題以外の国試問題のトークン数

$$
\begin{array}{|l|r|r|l|r|r|} \hline
資格 & 問題数 & 平均 &  & 最小 & 最大 \\ \hline
医師 & 9,990問 & 283.6 & ±165.7 & 73 & 1022 \\ \hline
看護師 & 3,930問 & 148.6 & ±53.6 & 66 & 461 \\ \hline
准看護師 & 1,950問 & 184.7 & ±44.8 & 86 & 374 \\ \hline
\end{array}
$$

ヒストグラムと箱ヒゲと生分布は、こう

意外と准看護師の問題が長めなのと、医師は長い方はどんどん長いけど、ピーク自体は准看護師より短いくらい

最小トークン問題

医師の最小トークン問題、73トークン

 Which of the following diseases needs airborne precautions?
a rubella
b varicella
c herpes
d influenza
e mumps

(医師117B8)

看護師の最小トークン問題、66トークン

 関節可動域〈ROM〉の単位はどれか。
1. kg
2. cm
3. 回
4. 度

(看護師104午前18)

准看護師の最小トークン問題、86トークン

 中耳にないのはどれか。
1 半規管
2 鼓室
3 鼓膜
4 耳管

(准看護師 令和2年度 A日程 4)

最大トークン問題

医師の最大トークン問題、1022トークン

 45歳の男性。歩行困難を主訴に来院した。2週間前の起床時に右足背に痛みを自覚し、その後、右足関節の背屈が困難になった。5日前から左手の示指と中指に痛みを伴うびりびり感が出現し、昨日から左足関節の背屈も難しくなったため受診し、入院となった。意識は清明。身長180cm、体重72kg。体温37.8℃。脈拍92/分、整。血圧150/72mmHg。呼吸数14/分。腹部は平坦、軟で、肝・脾を触知しない。脳神経に異常を認めない。筋力は上下肢とも近位筋は正常、遠位筋では左右差のある筋力低下がみられた。四肢の腱反射は全般的に低下し、Babinski徴候は陰性。左正中神経領域と右浅腓骨神経領域とに痛みを伴う感覚低下が観察された。小脳系に異常を認めない。髄膜刺激症候はない。尿所見:蛋白1+、潜血1+、沈渣に赤血球10〜20/1視野。血液所見:赤血球352万、Hb 11.8g/dL、Ht 32%、白血球12,500(桿状核好中球10%、分葉核好中球63%、好酸球1%、好塩基球1%、単球2%、リンパ球23%)、血小板18万。血液生化学所見:総蛋白6.6g/dL、アルブミン4.2g/dL、尿素窒素28mg/dL、クレアチニン1.7mg/dL、血糖96mg/dL、HbA1c 5.2%(基準4.6〜6.2)、Na 136mEq/L、K 4.2mEq/L、Cl 99mEq/L。免疫血清学所見:CRP 6.2mg/dL、抗核抗体陰性、MPO-ANCA 62U/mL(基準3.5未満)、PR3-ANCA 3.5U/mL未満(基準3.5未満)。胸部エックス線写真で異常を認めない。入院翌日の夜に下血があり下部消化管内視鏡検査を施行したところ、上行結腸に潰瘍を認め、生検を行った。生検組織のH-E染色標本(別冊No.21)を別に示す。
<img src="別冊No.21">
 最も考えられるのはどれか。
a 全身性エリテマトーデス〈SLE〉
b 顕微鏡的多発血管炎
c Guillain-Barré症候群
d サルコイドーシス
e 多発性硬化症

(医師112A49)

看護師の最大トークン問題、461トークン

 A君(6歳、男児)は、父母と姉との4人で暮らしている。3歳児健康診査で運動機能の発達の遅延を指摘され、5歳のときにDuchenne〈デュシェンヌ〉型筋ジストロフィーDuchenne muscular dystrophy
の確定診断を受けた。現在は、床からの立ち上がり動作に介助が必要である。見守りが必要ではあるが、室内の歩行は自立している。在宅支援サービスは利用していない。A君の外来受診時に母親から「最近、Aの世話をしていると、8歳の姉が私にしがみついて離れないので困ります」と看護師に相談があった。
 このときの看護師の対応で最も優先されるのはどれか。
1. 姉にA君の歩行の見守りをさせるよう勧める。
2. 居宅介護を利用して母が姉と関わる時間を確保することを提案する。
3. 姉の小学校の養護教諭に家庭訪問を依頼する。
4. 短期入所を利用して父母と姉とで旅行するよう勧める。

(看護師106午前67)

准看護師の最大トークン問題、374トークン

 Aさん(21歳、男性)。数日前から自室に引きこもり、意味不明な言動もみられるため、家族に連れられて精神科を受診。統合失調症の診断で、初回入院となった。入院後、服薬を拒否している。看護師が本人に話を聞くと、「悪い奴らに狙われていて殺される」「その薬も毒が入っている」「今も監視されていて怖い」と訴えた。
 対応で適切なのはどれか。
1 「どんなふうに監視されているのですか?」と詳しい説明を求める。
2 「薬は治療に必要なので飲んでください」と強い態度で伝える。
3 「殺されるかもしれないと思うと怖いですよね」と本人の気持ちに寄り添う。
4 「それは妄想であって、現実ではありません」と妄想を否定する。

(准看護師 令和3年度 A日程 150)

連問

長文問題は連問なので、前のやり取りを含めて次に質問しています
なので、質問のトークン数がどんどん増える
正味のトークン数は、連問を1まとまりとして勘定しました

$$
\begin{array}{|l|r|r|l|r|r|} \hline
& 連問数 & 平均 &  & 最小 & 最大 \\ \hline
医師3連問 & 230セット & 1161.0 & ±276.4 & 586 & 2054 \\ \hline
医師2連問 & 230セット & 902.6 & ±243.6 & 448 & 1716 \\ \hline
看護師3連問 & 433セット & 852.6 & ±180.0 & 495 & 1378 \\ \hline
看護師2連問 & 9セット & 686.3 & ±140.1 & 511 & 903 \\ \hline
看護師1連問 & 3セット & 519.0 & ±49.8 & 464 & 561 \\ \hline
\end{array}
$$

看護師の1連問は悩むとこだけど、長文はあるので

ヒストグラムと箱ヒゲと生分布

3連問が長くなるのは当然
でも医師の方が看護師より長いのは言えそう

どんな問題かは省略
興味のある方は、ぜひドリルで

$$
\begin{array}{|l|l|l|} \hline
& 最小 & 最大 \\ \hline
医師3連問 & 100\text{C}10〜12 & 110\text{G}66〜68 \\ \hline
医師2連問 & 96\text{F}47〜48 & 116\text{E}45〜46 \\ \hline
看護師3連問 & 93午後64〜66 & 109午後100〜102 \\ \hline
看護師2連問 & 107午前119〜120 & 106午後115〜116 \\ \hline
看護師1連問 & 107午後120 & 111午後120 \\ \hline
\end{array}
$$

年(回)別

国試1回分の総トークン数

そもそも問題数も試験時間も違うのであれですが、
医師の毎年の総トークン数は看護師の3倍くらいある
准看護師は看護師の半分くらい
多いほど、沢山読まされる

どの資格も、年によって大きく変わったりしないのは、試験時間が決まってるせいでしょうか
その点、医師国試は、第112回(2018年)に問題数が500問から400問に減って、総トークン数もちょっと減ってます
が、3日間の日程が2日間に短縮した割には変わらないような

$$
\begin{array}{|l|r|} \hline
& 試験時間 \\ \hline
医師(2018年以降) & 820分 \\ \hline
医師(2017年以前) & 920分 \\ \hline
看護師 & 320分 \\ \hline
准看護師 & 150分 \\ \hline
\end{array}
$$

読む分量

トークン数を試験時間で割って、1分当りのトークン数にしてみました
問題を読まなきゃいけないスピードの目安になるでしょうか

どの資格も大体似た感じ
人間が読む以上、読めるスピードの限界はある
ただ、グラフからは、年と共にじわじわ増えてる気もするし、
准看護師だけは、分量を減らしてるようにも見えます

英語ネイティブの読解スピードが200〜250単語/分だそう
英単語が1トークンなら、国試が200トークン/分なのは理解できそうな
一方、日本語の文字だと、我々ネイティブは600字/分で読めてるらしい
漢字が複数トークンになる話からすると、国試は随分ゆっくり?
矛盾

医師国試ブロック別

医師国試はブロックが多くて、問題区分の内訳が違ったり、ブロックで個性があります
もう少し詳しく、医師国試が500問から400問になって、ブロック数が9ブロックから6ブロックになった第112回(2018年)以降で見てみます

各ブロックのトークン数

色が重なって見にくいですが、毎年あまり変わらないことが見れれば
ブロックによって問題数や試験時間が違うので、単純な多い少ないは言えません
AとDのブロックでトークン数が多いのは、問題数の多さが効いてる感じ

1分当りのトークン数

大体一緒、ということは、求められる読むスピードはそう変わらない
でも、やっぱりAとDがやや高め
どちらも試験日午前で頭が元気だからいいのか

おわり

資格によって1問のトークン数は違うし、1回の国試で解かなきゃいけない量は違うけど、読むスピードはあんまり変わらない
ただ、医師は、問われる量も多いし、長時間読み続ける持久力も求められます

配点のコスパもだけど、分量のタイパも大事?

まだ読む


この記事が気に入ったらサポートをしてみませんか?