見出し画像

ChatGPT for generating multiple-choice questions: Evidence on the use of artificial intelligence in automatic item generation for a rational pharmacotherapy exam

下記の文章は論文のアブストラクトをChatGPTに解釈させたものであり、正確性は保証しません。

  • 論文タイプ:本研究は総説論文であり、掲載誌はEuropean Journal of Clinical Pharmacologyです。

  • 本研究の背景と関連研究:本研究の背景は、人工知能(AI)の利用が自動問題生成において有用であるということです。特に、ChatGPTという大規模な言語モデルは、質問(アイテム)作成において価値のある潜在的な利益を提供しています。関連研究としては、医学の薬物療法に関する合理的な試験のためにChatGPTを使用して症例に基づいた多肢選択問題を生成する可能性を調査した研究があります。

  • 本研究の目的とその重要性:本研究の目的は、ChatGPTを使用して症例に基づいた多肢選択問題を生成することの実現可能性を、アイテムの難易度と識別度のレベルの観点から評価することです。この研究の重要性は、人工知能を活用した自動問題生成の可能性を明らかにすることにあります。

  • 本研究で用いた材料やデータの詳細:本研究では、99人の医学部の4年生の学生を対象に、WHOの6ステップモデルに基づいて実施された合理的な薬物療法の実習に参加してもらいました。私たちが提示したプロンプトに対して、ChatGPTは高血圧に関する症例に基づいた10個の多肢選択問題を生成しました。専門家パネルの意見を経て、これらの多肢選択問題のうち2つが質問に変更を加えることなく医学部の試験に組み込まれました。試験の実施に基づいて、アイテムの難易度、アイテムの識別度(点二列相関)、オプションの機能性など、心理測定的な特性を評価しました。

  • 本研究で何をどのように、どこまで明らかにした?:本研究では、ChatGPTを使用して生成された2つの質問の点二列相関が、0.30以上の閾値を上回る受け入れ可能なレベルであることが示されました(0.41および0.39)。ただし、1つの質問は非機能的なオプション(試験参加者の5%未満が選択したオプション)が3つありましたが、もう1つの質問にはありませんでした。つまり、ChatGPTを使用して生成された質問は、高いレベルと低いレベルでの学生の違いを効果的に区別することができることが示されました。

  • 本研究の有効性はどのように検証した?:本研究では、生成された質問の心理測定的な特性を評価することによって、その有効性を検証しました。具体的には、アイテムの難易度、アイテムの識別度、オプションの機能性などを評価しました。

効果的なキーワードの提案:

この記事が気に入ったらサポートをしてみませんか?