BLEUとは

2023年6月2日 08:25

機械翻訳（Machine Translation）の評価をする指標としてBLEUというものがあります。言語モデルに関連する論文などを読むとよく出てくるのですが、どのような指標なのでしょうか。

今回の記事では、こちらの情報をもとにBLEUの仕組みについて解説します。

BLEUのアプローチ

大量の機械翻訳を熟練した専門家が評価する場合、完了までに数日から場合によっては数か月かかる場合があります。これはお金と時間のかかるプロセスです。

そこで2002年に発表された上述の論文は、自動で機械翻訳を評価する方法を提案しました。その方法による評価は、人間が行う評価とよく相関するようになっています。

自動なので専門家を雇う必要もなく、結果もすぐに出ます。つまり、安くて速いです。

論文では、その手法をBLEU（Bi-Lingual Evaluation Understudy、バイリンガル評価代行）と呼んでいます。

BLEUにおいて中心となる考え方は、「良質な機械翻訳は人間による翻訳に近いものであるべきだ」ということです。

そこで、彼らは参考とするための翻訳（参考翻訳）の例をたくさん集めたデータセット（コーパス）を作成しました。また、機械翻訳と参考翻訳とを比べるための計算方法を定義しました。よって、品質の判断を数値で行うことが可能となりました。

7,643字 / 2画像

¥1,000 / 月

初月無料

人工知能、機械学習、ディープラーニング、量子コンピュータ関連の用語の解説、研究論文の概要、プログラミングの具体例などの読み応えのある新しい記事が月に４−５本ほど追加されます。また、気になるAIニュースや日常の雑観などは随時公開しています。

この記事が気に入ったらサポートをしてみませんか？