見出し画像

共通テストの得点調整方法

 記事は約14分で読めます。全7819文字。

 先日、1月15日と16日に大学入学共通テストが行われました。実施2年目ということで難化が予想されていましたが、国語や数学などで予想を超える幅の難化が見られ、受験生は多くの混乱に見舞われることとなりました。そんな共通テストの知られざる良システム、得点調整とそのアルゴリズムである分位点差縮小法をゼロから解説します。

得点調整とは

 共通テストでは「地理歴史」「公民」「理科②」の特定科目間で、平均点に大きな差があった場合に得点が変わることがあります。これを「得点調整」と呼んでいます。共通テストの受験案内を見てみましょう。

2 得点の調整
(1) 得点調整について
 大学入学共通テストの本試験において,次の各科目間で,原則として,20点以上の平均点差が生じ,これが試験問題の難易差に基づくものと認められる場合には,得点調整を行います。
 ただし,受験者数が1万人未満の科目は得点調整の対象としません。
 ① 地理歴史の「世界史B」「日本史B」「地理B」の間
 ② 公民の「現代社会」「倫理」「政治・経済」の間
 ③ 理科②の「物理」「化学」「生物」「地学」の間
 
(2) 略
 
(3) 得点調整の方法
 ① 得点調整は,(1)の①~③のグループごとに,「分位点差縮小法」* という方式を用いて行います。
 ② 得点調整に当たっては,対象となる受験者と対象とならない受験者間での公平性の観点から,平均点差のすべてを調整するのではなく,調整後も平均点差が15点(通常起こりうる平均点の変動範囲)となるようにします。

大学入試センター『令和4年度 大学入学者選抜に係る大学入学共通テスト 受験案内』
p. 52 「F 試験実施後」より一部抜粋
なお、強調部は著者、省略は引用者による

 このように書いてあります。ここで注意したいのは、公民で唯一「倫理,政治・経済」だけは得点調整を受けないということです。そしてもっと重要なのが、受験者数が1万人未満の教科は調整対象とならないということ。

 昨年の共通テストでは生物が異常に優しく地学が異常に難しかったらしいのですが、得点調整を受けたのは物理と化学(が生物に近づいた)だけで肝心の地学は補正されず、という事件が発生しました。

 受験者数が1万人を切った場合は調整しないというのは分位点差縮小法の特性に起因するものなのですが、これについては後ほど説明します。

これでわかる「分位点差縮小法」

 ここでは方式自体の解説は定性的なものにとどめ、成立背景など社会科学的視点から見ることにします。数式をごちゃごちゃいじったりはしないけれど、アバウトな解説しかしないよということです。

 まず、受験案内の該当箇所を引用します。ただしこれを見ても多分よく分からないと思うので適宜読み飛ばしてください。

* 「分位点差縮小法」とは,得点調整の対象となる科目のうち,最も平均点の高い科目と最も平均点の低い科目の得点の累積分布を比較し,(中略)受験者数の累積割合(%)が等しい点(等分位点)の差(分位点差)を,一定の比率で縮小する方式です。
 また,平均点が最大及び最小の科目以外についても,素点の平均点差が同一の比率で縮小されるよう調整します。縮小の比率は,15点÷(最も平均点の高い科目の平均点-最も平均点の低い科目の平均点)とします。
 (以下略)

大学入試センター『令和4年度 大学入学者選抜に係る大学入学共通テスト 受験案内』
pp. 52-53 「F 試験実施後」より一部抜粋
なお、省略は引用者による

 まず方式の名称から見てみましょう。アルゴリズム名は分位点差縮小法。つまり、「分位点差」を「縮小」することにより得点調整を図る方法だということです。「分位点差」とは何かというと、引用部の第一段落において「等分位点の差」であるとされています。

 では「等分位点」とは何でしょうか。等分位点とは、「受験者の累積割合が等しい点」のことと書かれています。おそらくこの記述が分かりにくいのだと思います。累積割合とは「とあるデータが下から数えてどれくらいの位置にいるか」を表すものです。数学的な言い方をすると「累積度数を度数の全体で割ったもの」になります。累積相対度数とも言いますね。

 つまり、分位点差縮小法というのは「それぞれの科目について、受験者集団の中で何%の位置にいるかは変えずに得点差を減らすよ」という意味なのです。当たり前のことを言っている見えますよね。でも実はこれ、ちょっと特殊な方法なんです。

分位点差縮小法の特殊性

 それを紐解くために、分位点差縮小法の考案者である前川眞一さんの1998年の発言を見てみましょう。ここから先は、以下のサイトに載っていることをまとめてお話ししますので見たい方は下のリンクから飛んでください。

 まとめると、

 ① 同じ学力の子供が、同種の異なるテストを受験した場合、受けたテストに関わらず、順位が同じなら得点も同じであるべきだが、日本には「テストの素点は神聖にして犯すべからず」という民間信仰があるので、得点調整は緊急避難的でなければならない。

 ② このとき、緊急事態と平常時の連続性が担保される必要がある。たとえば平均点差20点を境界とするならば、平均点差が22点だった年度は点差が0になったのに、平均点差が18点だった年度は何もなしというのはまずいだろう。得点調整後もある程度の平均点差は残しておいたほうが良い。

 ③ また、得点調整の際は加点のみ全科目調整されなければならない。なぜなら、そうしなければ自分の(調整前の)得点を知っている受験生から「大学入試センターが作った欠陥テストの修正のためにどうして私のテスト得点が下げられなきゃいけないの」といった不満や、調整された一部の教科よりも少しだけ平均点の高かった別の科目のテストの受験者から「どうして私たちの点は調整してくれないの」といった不満が出ることが予想されるからである。

ということになります。

 上記①の本来の考え方に沿うのであれば、分位点差を「縮小」するのではなく、0にしなければならないはずです。実際そうした方式は古くから存在して、等百分位法と呼ばれています。古くから用いられてきた等百分位法ではなく、それを独自に改良した分位点差縮小法を用いているところに、共テ得点調整の特殊性が見られます。

やさしい「分位点差縮小法」

 ここから先は、実際の論文をもとに得点調整のアルゴリズムを定量的に解説します。数学が好きな方はぜひメモ用紙を片手にご覧ください。(※見出しの「やさしい」は『やさしい理系数学』の「やさしい」です。どういう意味か分からない人は読み飛ばすことをお勧めします。)

 参考にした論文は計測自動制御学会が発行する『計測と制御』の40巻8号に掲載された前川眞一さんの論文『大学入試センター試験における選択科目間の得点調整について』です。下にJ-STAGEのリンクを貼っておきます。

 まず、満点が$${M}$$[点]であるような$${n\ \left(\in\mathbb{N}/\{1\}\right)}$$[個]のテストに対して得点と累積割合の関係を集計します。このとき、テスト$${T_i\ (i\leqq{n},\ i\in\mathbb{N})}$$に関して任意の受験者が取る得点は$${X_i\ (\leqq{M},\ \in\mathbb{N}\cup\{0\})}$$[点]と表せますが、これが半開区間$${\left[ X_i-\dfrac{1}{2},\ X_i+\dfrac{1}{2}\right) }$$内の任意の実数を四捨五入したものと考えれば、平均値と中央値を保持したまま累積分布を狭義単調増加離散関数に変換することができます。また、度数全体が十分大きければ、これは狭義単調増加な連続関数と見ることが可能です。ということでテスト$${T_i}$$における得点の累積分布関数を$${p_i \ \coloneqq G_i(x_i) (0\leqq x_i\leqq{M})}$$と置くことができ ($${p_i}$$は割合のため無次元量)、これは全単射な関数(上への1対1の関数)になるので関数$${G_i}$$には逆関数が存在します。

 さて、対称性から$${\bar{x}_j\leqq\bar{x}_{j+1}\ (j\leqq{n}-1,\ j\in\mathbb{N})}$$としてよく、集合$${T_n\coloneqq\{x_n\}}$$は最も平均点の高い教科ですから得点調整の基準となる分布で「目標分布」と呼ばれます。今回行う得点調整は平均点差の最大値を特定の点差$${\alpha}$$[点]に縮小する調整ですから、テスト$${T_i}$$で$${x_i}$$[点]を取った受験者の調整後の点数を$${z_i}$$とするならば、$${\bar{z}_1 = \bar{x}_n - \alpha}$$[点]である必要があります。

 これにより、以下の式が成り立ちます。
   $${\bar{z}_1=\bar{x}_n-\alpha}$$
 $${\Leftrightarrow \bar{z}_1=\bar{x}_n-\dfrac{\alpha}{\bar{x}_n-\bar{x}_1} (\bar{x}_n-\bar{x}_1)}$$
 $${\Leftrightarrow \bar{z}_1=\left(1-\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}\right)\bar{x}_n+\dfrac{\alpha}{\bar{x}_n-\bar{x}_1} \bar{x}_1}$$
 $${\Leftrightarrow \bar{z}_1=w\ \bar{x}_n + (1-w)\ \bar{x}_1 \\ \quad \left(w\coloneqq1-\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}\right)}$$

 つまり、$${\bar{z}_1}$$は$${\bar{x}_1}$$と$${\bar{x}_n}$$とを$${w : 1-w}$$に内分する点です。これにより、「分位点差縮小法は、目標分布との差を$${1-w}$$倍に圧縮する調整である」ことが推測できます。これを今から確かめてみましょう。

 $${x_i}$$[点]の累積割合が$${p_i=G_i(x_i)}$$であることから、$${x_i}$$の等分位点は$${y_i\coloneqq G_n^{-1}(p_i)=G_n^{-1}\left(G_i(x_i)\right)}$$[点]となります。これにより以下の式が成り立ちます。次に掲げる1つ目の式が分位点差を定数倍率で縮小していること、2つ目の式が$${x_i,\ \bar{x}_1,\ \bar{x}_n,\ G_i,\ G_n,\ \alpha}$$だけで表記できていることを確認しておいてください。

   $${z_i=(1-w)x_i+w y_i}$$
 $${\Leftrightarrow z_i=\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}x_i+\left(1-\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}\right)G_n^{-1}\left(G_i(x_i)\right)}$$

 これが分位点差縮小法として妥当な変換か確かめるには、$${i=1}$$としたときに$${\bar{z}_1=w\bar{x}_n + (1-w)\bar{x}_1}$$を満たすか確かめれば良いですね。

連続関数として成立する条件

 前身であるセンター試験は$${\bar{x}_i\fallingdotseq60,\ \sigma_i\fallingdotseq18}$$でしたから、大きめに見積もって最下点である0点は$${\mu-3.4\sigma}$$の位置にあります。試験の母集団が正規分布に従うと考えれば標準正規分布表から$${P(0\leqq{Z}\leqq3.50)=0.4997}$$ですから、0点の受験者が全体に対して占める期待値は0.03%になります。

 ここで、$${m}$$人の受験者全員が0点以外を取る確率$${P}$$は$${P=0.9997^m}$$になりますが、受験者の中に0点がいると推定できるためには$${P\leqq0.05}$$を充足していなければなりません。これを満たす$${n}$$は
 $${0.9997^m\leqq0.05 \Leftrightarrow m\geqq\dfrac{\log0.05}{\log0.9997} \fallingdotseq 9984}$$
ですから、0点の受験者が発生しうるには1万人の受験者が必要になります。

 逆に言えば、$${x_i=G_i^{-1}(p_i)\ (0\leqq p_i\leqq1)}$$が全射である(上への関数である)、つまり$${G_i(x_i)}$$が(0付近で)そもそも関数として成立する、すなわち分位点差縮小法の計算が可能になるためには1万人の受験者がいなければ困るのです。これが「受験者が1万人を切った場合には得点調整を行わない」理由の一端だと思われます。

変換の妥当性

 $${z_1=\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}x_1+\left(1-\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}\right)G_n^{-1}\left(G_1(x_1)\right)}$$が$${\bar{z}_1=w\bar{x}_n + (1-w)\bar{x}_1}$$を満たすかどうかを確かめます。集合$${T_1=\{x_i\}}$$の要素は現状無限個で平均を算出することはできませんから、平均を求めるには受験者を有限($${m}$$[人])として後から$${m\to\infty}$$とするしかありません。

 ここで、累積割合$${p}$$は$${\dfrac{k}{m}\ (k\leqq m,\ k\in\mathbb{N}\cup\{0\})}$$しか取らないことに気を付けてください。すると累積割合を独立変数に、得点を従属変数にもつ($${G_i}$$とは逆方向の)任意の関数$${f}$$について、以下の式が成り立ちます。

 $${\bar{f}=\displaystyle\lim_{m\to\infty}\dfrac{\displaystyle\sum_{k=1}^m f\left(\dfrac{k}{m}\right)}{m}=\displaystyle\lim_{m\to\infty}\displaystyle\sum_{k=1}^m\dfrac{1}{m}\ f\left(\dfrac{k}{m}\right)=\int_0^1f(p)dp}$$

 すると$${\bar{x}_i=\displaystyle\int_0^1 G_i^{-1}(p)dp\ =M-\displaystyle\int_0^M G_i(x)dx}$$より、$${p=G_1(x)}$$と$${p=G_n(x)}$$で囲まれた面積を$${S}$$とすれば$${\bar{x}_n-\bar{x}_1=\displaystyle\int_0^M\left(G_n(x)-G_1(x)\right)dx=S}$$となります。よって、$${p\to z_1}$$もまた$${f}$$の一種であることを踏まえれば以下の式が成り立ちます。

 $${z_1=\dfrac{\alpha}{S}x_1+\left(1-\dfrac{\alpha}{S}\right)G_n^{-1}\left(G_1(x_1)\right)}$$
   $${=\dfrac{\alpha}{S}G_1^{-1}\left(G_1(x_1)\right)+\left(1-\dfrac{\alpha}{S}\right)G_n^{-1}\left(G_1(x_1)\right)}$$
   $${=\dfrac{\alpha}{S}G_1^{-1}(p)+\left(1-\dfrac{\alpha}{S}\right)G_n^{-1}(p)}$$

 $${\therefore \quad\bar{z}_1=\displaystyle\int_0^1 \left(\dfrac{\alpha}{S}G_1^{-1}(p)+\left(1-\dfrac{\alpha}{S}\right)G_n^{-1}(p)\right)dp}$$
     $${=\dfrac{\alpha}{S}\displaystyle\int_0^1 G_1^{-1}(p)dp+\left(1-\dfrac{\alpha}{S}\right)\displaystyle\int_0^1 G_n^{-1}(p)dp}$$
     $${=\dfrac{\alpha}{S}\bar{x}_1+\left(1-\dfrac{\alpha}{S}\right)\bar{x}_n}$$
     $${=(1-w)\bar{x}_1 + w\bar{x}_n}$$

 以上より、求めた式は確かに分位点差縮小法の式になります。いやまぁ論文内で「分位点差縮小法はこの変換として(僕らが求めた式)を用いる」って書いてあるので間違っている訳がないんですけどね。

まとめ

 平均点の低い順に並べた満点$${M}$$点の$${n}$$個のテスト$${T_i\ (i\leqq n,\ i\in\mathbb{N})}$$について得点$${x_i}$$の累積分布関数が$${p=G_i(x)}$$で与えられるとき、分位点差縮小法により平均点差が最大$${\alpha}$$点になるように得点調整を行うならば、調整後の得点$${z_i}$$は次式で与えられる。

 $${z_i=(1-w)x_i+wG_n^{-1}(G_i(x_i)) \\ \quad \left(w=1-\dfrac{\alpha}{\bar{x}_n-\bar{x}_1}\right)}$$

 また、累積分布関数によって分けられた累積分布図の上部の面積は、その分布の平均点に等しい。これを式で表したものは次式となる。

 $${\bar{x}=\displaystyle\int_0^1G^{-1}(p)dp=M-\displaystyle\int_0^MG(x)dx}$$

さいごに

 執筆依頼として題材を提案してくれたデジャヴくんに感謝。この記事を書いていて自分でも楽しく感じたし、内容としても非常に興味深いものだと自負しています。

 この記事がいいなと思った方は、スキやフォロー、シェアなどしていただけると励みになります。よろしくお願いします!

この記事が気に入ったらサポートをしてみませんか?