GLUE - 英語圏における自然言語処理の標準ベンチマーク
1. GLUE「GLUE」(General Language Understanding Evaluation)は、英語圏における自然言語処理の標準ベンチマークです。「同義言い換え」「質疑応答」といった、言語に関するテストデータが含まれており、このテストデータを使って総合的な言語能力のスコアを算出します。
英語圏の自然言語処理におけるデファクトスタンダードとなっており、新しい言語AIに関する論文を発表する際には、「GLUEスコア」を掲載することが慣わしとなっています。
ま