Empirical Study of Zero-Shot NER with ChatGPT

Ikemen Mas Kot

2023年10月23日 12:15

本研究の学術的背景および研究課題の核心は、大規模言語モデル（LLM）の情報抽出における性能を探求することです。具体的には、ChatGPTと固有表現認識（NER）タスクに焦点を当てています。本研究は、LLMの類似した推論手法をNERに適応し、NERに特化した推論戦略を提案します。
本研究の目的は、ゼロショットのNERにおけるLLMの性能を向上させることです。提案された推論戦略を用いることで、特定のラベルごとにNERタスクを分解し、構文の促進やツールの拡張、自己整合性の適用などを行います。これにより、異なるベンチマークにおいてゼロショットNERの改善が実現されました。
本研究の着想は、大規模言語モデル（LLM）の推論能力に関する先行研究の影響を受けています。特に、ChatGPTが持つ対話能力とリーディング・コンプリーヘンションタスクへの適用に関する研究に触発されました。また、情報抽出（IE）の重要性や、LLMの論理的な推論能力の可能性についての国内外の研究動向も関連しています。
本研究では、ChatGPTを用いたゼロショットNERタスクにおいて提案された推論戦略の効果を明らかにしました。具体的には、構文の分析や統計的手法を用いたデータの拡張など、ゼロショットNERの改善に寄与する方法を示しました。さらに、7つのベンチマークデータセットで実験を行い、提案手法の効果を評価しました。
本研究では、提案された推論戦略がゼロショットNERにおいて有効であることを実証しました。実験結果から、提案手法が特定ドメイン外や一般ドメインのデータセットにおいて、中国語や英語のシナリオにおいてもゼロショットNERの改善に大きく寄与することが明らかになりました。

この記事が気に入ったらサポートをしてみませんか？