見出し画像

項目反応理論について

項目反応理論は、学力テストやパーソナリティー・テスト(心理テスト)などのテストの特性を分析するための統計的なモデルです。名前に「理論」とついていますが、何かの巨大な理論体系というよりも、テストを分析したり採点したりするための枠組みというイメージで捉えて問題ないのではないかと思います。


ある受検者が、テスト問題に回答した結果を採点すると、問題毎に正解か不正解かいずれかのデータが得られます。例えば、テスト問題が10問の場合には、1人の受検者につき10個のデータが得られるわけですが、一般的な項目反応理論では、個々の問題に対する正誤のデータについて次のようなことを考えます。

A)正解/不正解には受検者の能力が関係していて、通常は能力が高いほど、問題に正解する確率が高くなる

B)ある問題に正解する確率は0から1の範囲の値を取り、0より小さい値になることや、1より大きな値になることはない(確率の性質)

C)難しい問題や簡単な問題、まぐれで正解しやすい問題やそうでない問題など、個々のテスト問題には、問題毎に固有の特性のようなものがある

どれも自然で納得感のある設定だと思います。項目反応理論では、AとBを表すような、なんらかの「関数」を用意した上で、Cの性質をパラメータを使って表現して、この関数に組み込みます。
同じことですが、別の言い方をすると受検者の能力と問題の性質をパラメータとしてもつ関数によって、問題に正解する確率を表現するのが、項目反応理論の特徴です。

実は、太字で書いた部分が項目反応理論の基本になる考え方で、通常の場合、項目反応理論とは何かを理解する上で重要なポイントは、この点に尽きるような気がします。

なお、いま能力と書きましたが、例えばパーソナリティ・テストの場合は、個人特性と呼んだ方が適切です。

ここから派生して、例えば以下のような事柄が問題になってきます。これらのほとんどはテクニカルな問題です。

✔︎問題の正誤と能力の関連性を表す関数には、具体的にはどのようなものを考えれば良いか

✔︎問題の特性を表すパラメータを、データからどのように推定するか

✔︎個人の能力をデータからどのように推定するか

✔︎正誤2値でない場合には、データをどのように取り扱うか etc.


なぜ、テストの分析のために、項目反応理論のような複雑なモデルを考える必要があるかということについて、例えば等化や適応型テストへの応用など実務上のメリットを挙げることもできますが、そもそもの動機としては『このような形でデータを捉えることが、モデルとして自然だったから』という面が大きいように思います。


この記事が参考になれば幸いです。


この記事が気に入ったらサポートをしてみませんか?