EMアルゴリズムによるIRTの項目パラメータの推定

2021年8月17日 13:45

項目反応理論（IRT）を活用した大規模テストを運用する場合，個人スコアの計算，すなわち回答データから能力特性値を推定する部分については，テストベンダーそれぞれが独自の仕組みを開発しているケースが多いと思います．

一方で，項目パラメータの推定については，何らかの既存のソフトウェアが利用されることが多く，テストの運用に関わる方の中には内部的にどのような仕組みで計算が行われているのか興味をお持ちの方もおられるのではないでしょうか．

ここでは，代表的なIRTの項目パラメータの推定の流れについて，大まかなイメージを解説してみます．

いま仮に大量の受験者の回答データ（正誤）と能力特性値がセットで手元にあるとして，このデータから項目特性値を推定することを考えます．
通常，能力特性値は連続値で，回答データは2値ですが，この計算は横軸を能力特性値，縦軸を正誤として曲線をあてはめる一種の回帰分析のような形になります．

一方，項目パラメータがわかっている項目群に対する回答データが存在する場合，これらの情報から受験者の能力特性値を推定することは，通常の採点と同じ流れです．

まとめると，次の2つはいずれも実行可能な課題だと考えられます．

A：回答データと能力特性値 ⇒ 項目パラメータを推定
B：回答データと項目パラメータ ⇒ 能力特性値を推定

上のAとBは，能力特性値がわかれば項目パラメータが推定でき，項目パラメータがわかれば能力特性値がわかるという，ちょうど表裏の関係になっています．

ですので『適当な初期値からはじめて，AとBを交互に何度も繰り返す』という方針で問題全体が上手く解けるように思えます．

基本的にこのような考え方でパラメータを推定する方法はEMアルゴリズムと呼ばれ，IRT以外でも一般に広く利用されています（厳密には，能力特性値を分布として取り扱い，これを寄与度と捉えて計算を行う）．

これが，項目パラメータの推定の際に，多くのソフトウェアの内部で行われていることです．計算のイメージは意外にシンプルだと感じていただけたのではないでしょうか．

正確にはどのような計算が行われているか，なぜEMアルゴリズムでパラメータの推定が可能なのかといった事柄については，やはり専門の書籍をご確認いただくのがよいと思います．

この記事が何かの参考になれば幸いです．

［参考］
『項目反応理論―基礎と応用（1991）』芝祐順（編著）東京大学出版会

普段、テスト理論とよばれる統計的な手法を応用した学力テストや心理尺度の開発、マーケティングデータの分析、社会人の方向けの統計の教育などに取り組んでいます。こちらのページに、統計やデータサイエンス、テストの開発についてよくいただくご質問に対する説明や、自分自身が疑問に感じた事柄を少しずつシェアしていきたいと思います。

この記事が気に入ったらサポートをしてみませんか？