SelfCheckGPT:大規模言語モデルにおける幻覚(事実ではない回答)を検出
ケンブリッジ大の研究者らが「幻覚を含む記述は一貫性に欠け矛盾を孕んでいる」というシンプルなアイデアに基づく幻覚検出ツールを開発。高い真偽判定精度を確認。外部データベースは不要とのこと。
論文:
より良質な記事をお届けするための取材費に使います!
ケンブリッジ大の研究者らが「幻覚を含む記述は一貫性に欠け矛盾を孕んでいる」というシンプルなアイデアに基づく幻覚検出ツールを開発。高い真偽判定精度を確認。外部データベースは不要とのこと。
論文:
より良質な記事をお届けするための取材費に使います!