(要約)「日本の学力調査は世界の“30年遅れ”」、専門家が言い切る“深刻なワケ”…!

「100点満点」の”文化”

 「テスト=100点満点」という常識が、日本の学力調査、ひいては教育政策をだめにしている。その典型的な例が「全国学力・学習状況」である。この調査が抱える欠点の1つが、学力の変化を測ることができない点である。

 ある年のテストの点が70点、次の年は80点だった時、学力が伸びたと判断はできない。なぜなら、単にテストが簡単だっただけかもしれないからだ。
 つまり、100点満点のテスト(≒正答数を学力の指標とする考え方)では、学力とテストの難易度、どちらが変化したのか区別することができない。だから、複数のテスト結果を比べても、学力の比較ができない。

異なるテスト結果、比べるには?

 正答数を学力の指標とする考え方はCTT(古典的テスト理論)と呼ばれているが、上述したような課題がある。
 そこで登場したのが、IRT(項目反応理論)というテスト理論だ。IRTのポイントは、"個々の設問に、個別の難易度がある"と考える点である。個々の設問に難易度があることで、難易度が同じ設問同士を入れ替えても、テスト全体の難易度は保たれるようになる。つまり、異なるテストの結果を比較することができるようになる。

 SNSが普及した現代では、一度出題したテストの設問は、漏洩してしまう可能性があるため、設問を毎回変えつつも、テスト全体の難易度は同じに保つという技術が求められている。
 難しい要請ではあるが、事前に難易度のわかっている設問を大量に確保し、試験のたびに入れ替えていけば可能である。実際、この技術は有名なTOEFLやTOEICといった試験で使われている。ちなみに、CBTにもIRTの発想は利用されている。

IRT活用を阻む、日本の「常識」

 実は日本の学校教育ではIRTがほとんど利用されていない。その理由の1つに、テスト直後にすべての設問を公にする日本のテスト文化がある。日本の学校では、テスト直後に「間違えたところを復習する」という名目で、テストの設問が全て開示されることが珍しくない。このような文化はIRTの観点からは都合が悪く、テスト直後にすべての設問を公開するという「常識」がIRTの活用を阻んでいる。

 見るところ、IRTの最大の欠点は「わかりにくい」という点に尽きる。結局のところ、現在の100点満点のテストは多くの人にとって、圧倒的にわかりやすいのだ。ただ、国が実施する学力調査の前提が、IRTを利用しない100点満点のテストなのはいただけない。IRTの利用は、世界の学力調査ではすでに常識だ。

 現在、他国ではIRTを活用した学力調査のデータが蓄積され、学力の変化やその要因を分析する研究が進んでいるが、こうした研究はIRTを前提とした学力データが蓄積されてからでないと行えない。今から日本が世界に追いつこうとしても、どう頑張っても10年はかかる。当然、追いつこうとさえしなければ、更に差は開くことになる。

日本の学力テスト、「失敗の要因」は…

 現代社会に置いて学力調査を設計する場合、IRTはほぼ必須の技術となっている。ところが日本の場合、IRTを知らない人が学力調査の設計・報道に関わっているケースが少なくない。

 断っておくが、IRTが万能というわけではない。例えば学校の教室で行う漢字の書き取りテストに、わざわざIRTを利用する必要はない。ただ、何事にも”最低限の基礎知識”というものはある。特に意思決定に関わる人であれば、せめて学力調査やIRTに書かれている知識くらいは踏まえてから行うべきである。

この記事が気に入ったらサポートをしてみませんか?