見出し画像

人材選抜において必要なこと(2)

前回、人材選抜において必要なこととして、「公平性」「信頼性」「妥当性」「実用性」についてお話ししました。今回はそれぞれについて、さらに深堀していきます。 ちょっと長くなりますがお付き合いください。(Mr.モグ) 

公平性について


人材選抜の「公平性」の問題は実は非常に難しい問題です。選抜テストの内容や採点処理の方法が公平であるべきことは当然のことであり、それが一部の人に有利もしくは不利になるような内容や採点方法では公平な選抜とはいえません。

例えば、身近な例でいうと、ある選抜試験を行ったところ首都圏の受験の平均点が100点満点中70点、他方、地方圏の受験の平均点が50点というケースの場合は、出題された選抜試験の内容が首都圏の受験者の有利な問題ではないかという疑念が生じます。(仮に、首都圏の住環境を題材にした問題などは、地方圏の受験者に不利に働くかもしれません。)

しかし、たまたま受験者の内訳を見たときに、首都圏に優秀な受験者が多くて、その平均点が高くなったことも考えられます。「公平性」の観点から重要なポイントは、意図的な差別の無い機会均等を維持するということなのです。

ただ、選抜の「公平性」については、その地域の文化的背景も大いに影響を与えます。

例えば、日本やアジア地域では、一般的に、全員が同一かつ画一的な扱いを受けることが、平等であり公平と捉える傾向が強いのですが(そのため、大学入試でも全受験者が共通した試験の得点で客観的に合否判定する方が公平と考える傾向が強い)、アメリカでは個々の能力は当然にして異なるので、各個人にあった能力指導や評価が適当と考える傾向が強く、むしろ同一の指導や評価は不公平であると考える傾向が強いのです。

その一例として、アメリカでは近年、大学入試の公平性に関して、ハーバード大学の入学者選抜が、アジア系米国人(主に中国系と韓国系)を差別しているか否かの裁判が始まりました。
 原告(※1) によると、「アジア系の志願者は、学力が極めて高いにもかかわらず、合格者に占める比率は常に20%前後である。これは、ハーバード大学が、アジア系学生数の上限を意図的に設定しているからであり、人種による差別を禁じている公民権法違反である」と訴えているのです(※2) 。

※1)「公正な入試を求める学生Students for Fair Admissions(SFFA)」と称するハーバード大学に不合格となったアジア系の学生集団
※2)今回の裁判では、学力だけで合否を決めたとすればアジア系米国人の比率は19%から43%まで上昇することを示した内部調査の報告書の存在が明らかにされ、もし人種が考慮されなければ、アジア系米国人の比率は40%になるはずだと原告は主張しているのです。

アメリカにおける入学者選抜の公平性については、既に連邦裁判所が、人種ごとに比率を決めるクォータや、特定の人種の志願者に画一的に点数を付与することは違憲であるが、教育使命を実現するために、志願者一人ひとりの人種を考慮して合否を決めることは違憲ではないとしています。(そのため、テスト得点以外の主観的な基準を合わせた総合評価は合憲とされているのです。※ )

※ ちなみに、2~3名の評価者が5つの領域(学力、課外活動、スポーツ、人柄、総合)について評価を行うとされ、その際、人種的マイノリティ、同窓生の子弟、寄付者の親戚、教職員の子弟、運動選手等には、特別な配慮がなされることをハーバード大学は認めているのです。

日本においても、近年、大学入試では、選抜の多様化が進み、同じ学部でも、AO入試で合格する人や、選択科目も多く取り入れられる中で、選択科目の難易度の違いによる有利不利等、「公平性」を一律に保証することが難しくなってきています。しかし、選抜に関わる者としては、まずは「公平性」の確保に配慮する必要性については心にとめておく必要があるのです。

さて公平性を確保した上で、次に、選抜の際に考えなければならないことは、受験者の能力を、「如何に正確に測定することができるか」ということになります。

テスト理論では、正確に能力を測定するためには『信頼性※ 』『妥当性』が、重要であるとしています。

※ テストの測定精度のことで、真の得点を、より正確に測定できているほど信頼性が高いとされています。


信頼性について

一般的に、古典テスト理論では、テストの得点を次のように示しています。

         テスト得点=真の得点+誤差
 
わかりやすいように、例えば、数学の能力を測定するとしましょう。そのときに、何回テストを受けても60点であれば良いのですが、(同じテストなのに)1回目は80点、2回目は50点、3回目は60点といったようにブレが生じる場合、「誤差」が大きいので、測定精度が低い(「信頼性」の低い)テストとされます。逆に、この「誤差」が少なければ(何回受けても同じ結果になるテストであれば)「信頼性」の高いテストとされるのです。

すなわち、「信頼性」の高い選抜テストとは、受験者の能力を正しく反映したものであり、繰り返し測定した場合にも安定性のある結果が出るのです。

例えば、毎年、同じような時期に行われる選抜テストの場合、毎年同質の問題を作成し、安定した結果を出すことが望まれます。そのためには、選抜に必要な能力を測る上で基礎的で重要な事項を中心に問う問題を出題することが重要になります。

仮に、(基礎的ではない)細かい知識の有無を問う問題を出題した場合は、ある受験者がたまたま知っていた知識を問うことにつながり、その時々の運・不運の影響が出やすくなるのです。

この「信頼性」「信頼性係数」として、次のように計算することができます。

テスト得点の分散(すなわちテストの得点の散らばり具合)
  =(真の得点+誤差)の分散
  =真の得点の分散+誤差の分散
   
これにより
信頼性係数=真の得点の分散÷テスト得点の分散  となります。

しかし、「真の得点」を明らかにすることは大変です。ちなみに、テスト理論では次のような三つの方法により「信頼性係数※ 」を推定します。

※ 信頼性係数は、正確性を期す必要のあるテストでは0.9以上、学力テストなどでは0.8以上、心理特性等のテストでは0.7以上必要とされています。

①再テスト法:同じ受験者集団に、同じテストを二回繰り替えして行うものです。その結果得られた二回のテスト結果の相関係数が信頼性係数の推定値となります。(この場合、同じ受験者の能力が変化しないことが条件になります。答えを覚えたりしていると正しい信頼性係数が算出されないことになります。)


②平行検査法:信頼性係数を測定したいテストと同じような内容のテスト(難易度や問題数、出題内容、試験時間等を同じにしたもの)を作成し、これら二つのテストを同一受験者に実施して、二つのテスト結果の相関係数が信頼性係数の推定値となります。


③折半法:一つのテストの中身をできるだけ同じような問題二つに分けて(例えば、偶数番号の問題と奇数番号の問題といったように、二つのテストに折半して)、この二つの部分のテスト結果の相関係数が信頼性係数の推定値となります※ 。

※この他にも、クロンバックのα係数を用いる方法がありますが、ここでは省略します。

 一般的に、テストの「信頼性」を向上させる方法としては、問題数を多くすることが挙げられます。

例えば、英語の単語試験で、5題の出題数よりは、10題、さらには50題の方が、たまたま知っていたから出来た(あるいは出来なかった)ということを防ぐことが可能になります。
しかし、選抜テストの時間的制約など様々なことから多数の問題を出せない場合もあり得ます。

特に記述式の問題は、様々な制約から問題数が(多肢選択式の問題に比べて)少なくなる傾向が強く、出題者は特に配慮が必要になるのです。

妥当性について

妥当性とは、その選抜試験が測定しようとしているものを、どの程度的確に測定できているかということです。
例えば、「営業スタッフとしての適性」を調べるのに、「事務作業効率の適性」を調べるテストを行っても、測定しようとする営業の能力を正確に測ることは難しいでしょう。このように「妥当性」とは、テストが測ろうとしているものを測れるようになっているか否かの程度を表す概念のことです。


「妥当性」の高い選抜テストを創るためには、「限られた出題数の中で、選抜で見抜きたい能力や知識を測定するに相応しい基本的・本質的な問題となっているか。」「(選抜によって、)欲しい人が採用され(合格し)、相応しくない人を排除できる問題となっているか。」という点に留意する必要があります。

この「妥当性」には、以下のようなものがあります。
 ・内容的妥当性
 ・基準関連妥当性
 ・構成概念妥当性

これらを説明すると次のようになります。

内容的妥当性
テストの問題内容が、本来測定したい内容を含んでいるか、というものです。 例えば、数学の能力を測りたいときに、文章読解問題や英語の問題を出題するのは、内容的妥当性を満たしていないといえます。この内容的妥当性は、測定すべき要素の全体構成が分かっている場合には、その測定すべき要素が入っているかを確認する必要があります。
 
基準連関妥当性
選抜のために作成したテストと、そのテストと関連のある(他の)テストや評価結果(これらを「外的基準」という)と相関しているかということです。つまり、選抜のために作ったテストの得点と、外的基準として(ほぼ)確立されているテストの得点との間の相関が高ければ、このテストの基準連関妥当性が高いと言えます。
(例えば管理者として能力検査であれば、部下や同僚による外部評価、業績などが外部基準となり、能力検査の得点と外部基準の相関が高ければ妥当性は高いということになります。)
 
構成概念妥当性
測定しようとする概念や特性を、どれだけ適切に反映しているかを意味します。例えば、総合的な事務能力を測る選抜テストを作るために、測定する因子として、計算処理能力と文書読解能力を組み合わせることで構成概念妥当性を高くすることができます。

なお、妥当性の検証方法としては、専門的観点から選抜テスト問題の内容をチェックすることが考えられますが、採用後(もしくは合格後)に、何らかの基準(例えば、採用後の勤務成績や、妥当性の確認されている他の指標等)と相関関係を確認することが考えられます。
(しかし、採用後の勤務成績は、それぞれの業務の違いや職場環境の違いにより、単純な比較は難しいこと、不合格者(不採用者)の勤務成績を得ることは出来ないことなどやっかいな問題も多く、なかなか検証は難しい状況にあります。)

「信頼性」と「妥当性」については、次のような概念的説明が行われます。わかりやすいので、参考までに紹介すると次のようになります。

信頼性と妥当性の図

    D        C        B        A

図のように、ABCDの4人が矢を射る競技をしています。的の中心に矢を当てることができれば、(競技の目的が的の中心に矢を当てることなので)「妥当性」が高いと評価できます。
他方、矢を射る精度という観点からみると、毎回同じような場所に当たった方が、精度は高い、すなわち「信頼性」が高いとなるのです。
Aは的の中心に当たっていることから「妥当性」が高く、矢は毎回同じところに当たっているので「信頼性」も高いとなります。
Bは、的の中心からいずれも離れているので「妥当性」は低いということになり、また、毎回バラバラのところに当たっているので「信頼性」も低いといえます。
Cは、的の中心を挟んで、バラバラに当たっています。
このなかでは「妥当性」はありそうです。他方、毎回バラバラに当たっているので「信頼性」は低いとなります。
同様にDは、毎回中心から離れているので「妥当性」は低いのですが、毎回同じようなところに当たっているので「信頼性」は高いといえるのです。

このように考えていくと、一言に選抜テストといっても、「公平性」を確保した上で、「妥当性」「信頼性」を併せ持つテストを創ることの難しさは容易に理解できるでしょう。


実用性について

選抜テストにおいては、これに加えて『実用性』が必要になります。
これは、人、時間、機材、資金など選抜テストに利用されるリソースが有限であることから、選抜テストを効率的に安定的に実施するために必要な要素です。
前述したように、いくら理想的な選抜方法を考えても、それを実施するのにコストや負担が多すぎると、実際に選抜することが困難になります。(また、受験者の負担が多すぎると、その選抜テストに受験者も集まらなるかもしれません。)

ちなみに、マイナビ の最近の調査※によると、新卒採用にかかる費用は表のようになっており、企業規模により差はあるものの、入社予定1人当たりの採用費用平均は全体では53.4万円となっています。

※ 2018年卒マイナビ企業新卒内定状況調査(2017年11月)

まいなびの調査

採用費のうち一番コストがかかっているのは、広告費で、就職情報誌や就職情報サイト、新聞など、一般に公開される採用情報を掲載・出稿するための費用に多くのコストをかけていることがわかります。

採用戦略としては、たくさんの広告をすることで、選抜の対象者を多く集め、その中から実際の選抜を行うということなのでしょう。
ちなみに、採用費総額から、広告費等を差し引いた残りの金額を参考に付けておきました。(=A-B-C-D)
選抜等には平均で総額65万円程度しか使えないのです。
「実用性」の面から考える場合、選抜のためのコストに限界があるとともに、選抜方法の負担についても考慮することが必要になるのです。

このように人材選抜における主な留意点として、公平性、信頼性、妥当性、実用性が必要なことを述べてきました。
人材選抜の究極的な目標は、
① 相応しい人材を確実に選抜すること。
② 相応しくない人材を確実に排除すること。

になりますが、その選抜の道具が選抜テストになるわけです。

しかし、いくら良い選抜テスト(道具)が揃っていても、それがうまく機能するために必要な前提条件があります。
それは、求める人材が選抜テストの受験者層に含まれているかということです。たとえ良い選抜テストがあっても、そのテストを受けていない者から、良い人材を選び出すことは出来ません。選抜テストの前段階(エントリー段階)で、一つの分かれ目があるのです。
その分かれ目を左右する要因の一つは、その採用組織の「魅力」「人気度」だと思います。皆が入りたいと考える大学や組織には、多くの受験者が集まり、競争率や試験倍率が高くなります。

人材選抜を行う上では、選抜の道具としての選抜テストの測定性能の高さは、当然、必要なのですが、優れた受験者層の一定数の確保も必要であることは心にとめておく必要があるのです。

次回は、人材選抜を行う上での基礎知識として、「知っておきたい統計知識」をわかりやく説明しようと思います。


この記事が気に入ったらサポートをしてみませんか?