Evaluating GPT as an Adjunct for Radiologic Decision Making: GPT-4 Versus GPT-3.5 in a Breast Imaging Pilot
https://www.sciencedirect.com/science/article/abs/pii/S1546144023003940
1. 本研究の学術的な背景と研究が解決する問題は何ですか?
→ 大規模言語モデル(ChatGPT-3.5とChatGPT-4)を用いた臨床決定支援のための研究はまだ少なく、評価されていません。本研究は、ChatGPT-3.5とChatGPT-4を用いて、乳がん検診や乳房疼痛に対する適切な画像診断方法を特定することで、放射線学的臨床決定支援の能力を評価します。
2. 本研究の目的と独自性は何ですか?
→ 本研究の目的は、ChatGPTを用いて放射線学的臨床決定支援を評価することです。これは、従来の画像診断に基づく方法と比較して、クリニカルワークフローの改善や、放射線診断サービスの責任ある使用の促進を可能にする可能性があることを示唆しています。
3. 研究の着想を得た経緯や、関連する国内外の研究動向とは何ですか?
→ この研究は、大規模言語モデルを臨床決定支援に使用することの可能性を評価する初めての研究の1つです。先行研究では、ChatGPTの使用に関するアプリケーションが検討されていますが、臨床決定支援のために使用される可能性に関する研究はまだ限られています。
4. 本研究で明らかにされた成果は何ですか?
→ 本研究では、ChatGPT-3.5とChatGPT-4が、乳がん検診や乳房疼痛に対する適切な画像診断方法を特定することで、放射線学的臨床決定支援の能力を示すことができました。特に、ChatGPT-4は高い正解率を示しました。
5. 本研究の有効性はどのように検証されましたか?
→ 本研究では、ChatGPT-3.5およびChatGPT-4を用いて、乳房疼痛および乳がん検診の画像診断方法についてOEおよびSATAの形式でプロンプトを与え、ACR基準と比較した結果を評価しました。この結果、ChatGPTを用いた放射線学的臨床決定支援の可能性が示されました。