見出し画像

人材選抜にかかわる人の基礎知識(統計編)

能力測定の基礎知識

選抜を扱う者にとって、得点の扱い方は非常に重要なことになります。単純に複数のテストの得点を合計しただけでは、その受験者の能力を正しく測定したことになりません。

具体的な例(数学と英語からなる選抜試験を行うケース)を考えてみましょう。
受験者Aは難しい数学のテスト(受験者全体の平均点は30点とします)で60点、比較的易しかった英語のテスト(受験者全体の平均点は60点とします)で60点をとったとします。
一方、受験者Bは同様のテストで数学は32点(平均点は30点)、英語は88点(平均点は60点)とったとします。
このとき単純に数学と英語の得点の合計では、受験者Aは、120点(60点+60点)、受験者Bも120点(32点+88点)で、同じ点数になります。しかし、Aは難しい数学のテストで平均の二倍の点数をとり、英語は平均の60点であり、Bは数学は平均点よりもわずかに高い32点で英語も平均より高い点数でした。両者の差をどうしたらはっきりさせることが出来るのしょう。

平均・中央値・最頻値

ここでまず考えなければならないのは「平均」の考え方についてです。100点満点のテストがあったとして平均点が50点の場合、それはどういうことになるのでしょう。
一般的に、「平均点」とは選抜試験の成績の真ん中の得点あるいは、その点数のところに多くの受験者が集まっている点数であると考えてしまうことが多いでしょうが、これは必ずしも正しいとはいえないのです

名前    得点
Aさん  90点
Bさん  80点
Cさん  40点
Dさん  60点
Eさん  90点


平均点は一般に次のように求められます。
Aさん、Bさん、Cさん、Dさん、Eさんのテストの数学の得点が、上のような場合、平均の得点は、
(90 + 80 + 40 + 60 + 90)÷ 5 = 360 ÷ 5 =72
となり、72点であることが分かります。


平均点は、その求め方からすると受験者全員の得点を集めて、それを全受験者の人数で割って求めるので、受験者の得点を見比べながら少しでも得点の高いものは低い点の者に点数を与えていき、最終的に全員が同じ得点になるようにしたときの得点ともいえます。
この「平均値」は、集団の中心的傾向を示す値である「代表値」の一つですが、他にも、「中央値」「最頻値」を代表値として使う場合もあります。

中央値(メディアン)は、母集団の分布の中央にくる値のことです。データの個数nが奇数のときは真ん中の値を取りますが、偶数のときは真ん中の二つを加えて2で割った値となります。中央値より大きい値の個数と小さい値の個数は同数となります。


 先程の例では、点数を順に並べると、90 90 80 60 40 となり、真ん中は80なので、これが中央値になります。

また、最頻値(モード)は最も多い度数(頻度)を示す値のことです。(ヒストグラムから最頻値を求める場合には、最も度数の多い階級の階級値となります。)
これも先程の例では、90が最も度数が多いため、これが、最頻値となるのです。

このように、集団の中心的傾向を示す「代表値」の捉え方は異なるのです。そのため、例えば、平均点が60点という時、多くの場合は60点ぐらいのところに多くの受験者が集まっている、あるいは60点位の点数とっている受験者は、全体の真ん中くらいの順位であると考えますが、得点の分布よっては正しくないことがあります。

中央値グラフ 得点分布による「平均値」「中央値」「最頻値」の違いについては、上の図を見てもらえばイメージがつかめると思います。

例えば、次のグラフは10点満点で平均点が同じ5.1のケースですが、得点分布が異なっています。

平均点グラフ

2つのうち、下のグラフの得点分布では、得点の高いものと低いものがはっきりと分かれており平均点の付近で受験者の数が少なくなっています。しかし、平均点は5.1となります。

もちろん、これは極端な例ですが、受験者数のピークがいくつかに分かれるという現象が起こり得ますので、平均点付近が最も受験者数の多い得点を示している場合だけでは無いことを知っておく必要があります。

さらに、極端に高い得点を取っている者が少数いる場合、その高い得点に全体が引っ張られて、平均点が高めに出ることもあります。(当然ですが、その少数の受験者集団を除くと、平均点はもっと低くなります。)

このように平均点にはテストの得点の分布が歪んでいて極端な点数が含まれている場合、その数値のほうに引っ張られてしまうことがあるのです。
なお、この平均点を、割合で示したものが「平均正答率」です。問題数の異なる試験の難易度を比較するときには、平均正答率を用いると、各問題集の難易度の違いを把握することが容易になります。

例 各問題の配点が1点の問題集の問題数が60題で、平均点が40点の時の「平均正答率」は、66%となります。
一方、各問題の配点が1点の問題集の問題数が100題で、平均点が55点の時の「平均正答率」は、55%となるので、両方の問題集が、同じ能力を測っているとすると、後者の問題集のほうが難しい問題集ということになります。


分散と標準偏差

分散とはデータのバラツキを示す指標です。平均からのズレを二乗して(絶対値として扱うため)全部足し合わせて、その結果をデータ数で割ることで、一人当たりバラツキ量を示したものです。


名前  得点
Aさん  90点
Bさん  80点
Cさん  40点
Dさん  60点
Eさん  90点

先程の例(上図)で分散を求めてみましょう。

平均は72点なので、まずは、偏差を求めてそれを二乗します。
Aさん:90―72=18  18×18=324
Bさん:80―72=8  8×8=64
Cさん:40―72=-32 -32×-32=1024
Dさん:60―72=-12 -12×-12=-144
Eさん:90―72=18  18×18=324

 偏差の総和は1880(=324+64+1024+144+324)
これを5人で割るので、376(=1880÷5)となります。
そのため、A~Eの点数の分散は376となります。しかし、この値は、二乗されているので、このルートをとると、√376 = 19.39 となります。(これは、A~Eの点数の差を示したもので「標準偏差」といいます 。
ちなみに分散を求める式は次のようになります。

標準偏差

標準偏差

標準偏差の求め方は、各試験の得点と平均点の差を二乗した数値を平均した数値(すなわち分散)の平方根で示され、次の式のようになります。

分散の平方根

標準偏差とは試験の各得点が平均点からどれくらい離れているかを示す指標ですから、実施した選抜試験全体としての標準偏差が大きいということは、各得点が平均点の周りに広くばらついていることを意味します

逆に、標準偏差が小さいということは、各得点が平均点の周りに集中していることを意味します。

ある能力に関して散らばり具合が同じような二つの集団があり、その能力を測る2種類の試験があるとします。それぞれの集団に別々の試験を実施した時、一方の試験の標準偏差が他方のそれよりも大きいならば標準偏差が大きい値を示した試験を用いた方が、(標準偏差が小さい値を示した試験よりも)集団の能力の散らばり具合を敏感に反映した試験であると考えられます。
特に選抜試験においては各受験者の得点にあまり差がつかず、全員がほとんど同じような得点になる試験よりも、能力の差を少しでも的確に測れる試験の方が望ましいのですから、標準偏差によって試験問題の性能を評価することもできるわけです。

次回は、さらに統計的センスを深めていくために、標準得点や相関係数などについて解説していきます。これらのことが分かれば、異なる試験間、の関係性や、受験者の能力の特性を、よりよく理解することができるようになると思います。
 引き続き、できるだけわかりやすく人材選抜を行う(もしくはそのための努力をしている)「あなた」のために有用な情報を提供して行こうと、年末年始も頑張ろうと思います。

こんなことを知りたいというご希望があれば、それについても解説していきたいと思います。(by Mr.モグ)

この記事が気に入ったらサポートをしてみませんか?