見出し画像

機械翻訳とポストエディットをどう考えるか

こんにちは。レビューアーの佐藤です。昨今の産業翻訳業界で、避けて通れない話題の1つが「機械翻訳(Machine Translation)」です。略して「MT」とも呼ばれます。

翻訳は労働集約型産業で、人力に依存する部分が多いため、効率向上が難しい仕事です。その問題を解決する手段として、以前から期待されていたのが機械翻訳です。最近はGoogle翻訳のようなWebサービスも多くあり、皆さんも一度は機械翻訳を使ったことがあるのではないかと思います。

産業翻訳の世界では、文芸翻訳と違い、一定の品質の翻訳を「商品」として効率よく生産することが求められるため、機械翻訳を活用した効率化は無視できない流れになっています。お客様から問い合わせを受ける機会も増えてきたので、ここで一度、機械翻訳に対するトップスタジオの考えをまとめたいと思います。

機械翻訳は本当に「使える」のか?

先に結論を言ってしまうと、「時と場合によっては使える」です。グレーな結論で申し訳ないですが、それ以外に言いようがありません。

2019年に、AIの導入でGoogle翻訳のレベルが一気に向上したことが話題になりました。確かに、一昔前に比べれば機械翻訳の精度は上がっています。DeepLのように、従来の機械翻訳で不得意とされていた口語の文をかなりきれいに訳してくれるサービスも登場しています。私自身、心得のない言語(スペイン語とかポーランド語とか……)で書かれた情報の中身をざっくり知りたいときは、こうした機械翻訳サービスをよく利用しています。ただ、業務としての翻訳に使えるかというと、必ずしもそうではありません。

業務としての翻訳では「原文の意味がもれなく正確に訳されていること」と「自然な日本語になっていること」が重要ですが、機械翻訳ではこの2点をカバーしきれないことがあります。特に、原文の書き方が少々複雑である場合には、機械翻訳の力だけで読みやすく正確な訳文を作ることは困難です。

例をお見せしましょう。Googleの開発プラットフォームであるAppSheetのサイトに掲載されていた「お客様の声」を、DeepLで翻訳してみました(2021年5月初めに実行した結果)。

【原文1】
Using AppSheet, we were able to design and launch a full end-to-end app in just two days.
【DeepL翻訳】
AppSheet を使用して、わずか 2 日間で完全なエンドツーエンドのアプリを設計し、ローンチすることができました。
【原文2】
What AppSheet did was allow me to really quickly create a tool to collect data.
【DeepL翻訳】
AppSheetができたのは データを収集するツールを本当にすぐに作れるようにしてくれたことです。

【原文1】のほうはDeepLが非常にきれいに翻訳してくれましたが、【原文2】のほうは少々残念な出来です。このように、機械翻訳の品質は、原文の書き方によって大きく左右されます。したがって、使える場合もあれば、使えない場合もある、という話になります。

ポストエディットは効率化に役立つか?

この弱点をカバーするために考えられたのが、機械翻訳で生成された訳文を人間が見直して仕上げる「ポストエディット」という手法です。機械翻訳にすべてを任せるのは無理としても、その後を人間がチェックするようにすれば、品質的にも問題ないし、最初から人間が訳すより早いのでは?と考えたのですね。気持ちはわかります。ただ、これについても、効率化につながるかは「時と場合による」と言わざるを得ません。

先ほどの【原文1】の例ぐらいきれいに訳してもらえれば、人間はさっと見てOKを出すだけです。仮にクライアントの好みを考慮して、「ローンチすることができました」を「ローンチできました」に修正したとしても、かかる時間は微々たるものです。

では、【原文2】のほうはどうでしょう。正直なところ、こちらのDeepL翻訳は一部手直ししてどうにかなるレベルではないので、一から訳し直すことになります。この場合、ポストエディット担当者は「機械翻訳をそのまま使えるかどうか」という判断をした後に、あらためて一から翻訳をするので、余計な工程が1つ増えてしまいます。手間が減るどころか、増えてしまうのです。

全体の7~8割について【原文1】レベルの機械翻訳が提示されるなら、それは大きな効率化になります。そうでない場合には、むしろ効率的にはマイナスです。このあたりが、ポストエディットを採用するかどうかの判断で難しいところです。効率が上がるかどうかは機械翻訳の質によるところが大きく、機械翻訳の質が保証されるかどうかは原文の書き方に左右されます。そのため、ポストエディットは必ず効率化につながります!と断言することはできません。

 で、結局どうなの?

産業翻訳の世界も価格競争にはあらがえず、少しでも翻訳コストを抑えたいクライアントの意向で、機械翻訳とポストエディットを取り入れるケースが増えています。言語的に機械翻訳が難しいと言われてきた日本語の翻訳プロジェクトでも、その波は確実に押し寄せています。

機械翻訳とポストエディットにどういう立場をとるかは翻訳会社や翻訳者にとって難しい判断ですが、現状、トップスタジオとしては、機械翻訳に伴うポストエディットを積極的にお引き受けしていません。その大きな理由は、ここまでに書いたとおり、効率化に役立つか、採算に合うかどうかは「場合による」からです。

ポストエディットの仕事を成功させ、発注者と受注者の双方が満足する成果を得るには、以下の条件が揃っていることが必要です。

・精度の高い機械翻訳エンジン
・機械翻訳に適した書き方の原文
・機械翻訳に適したコンテンツ(字幕やマーケティング資料は不向き)
・案件に適した訳語リスト
最終的な訳文品質についての合意(日本語として読めればいいのか、人間による翻訳と同等の品質を求めるのか)

特に重要なのが最後のポイントです。機械翻訳にどこまで手を入れるか、最終的な目標をどこに置くかによって、ポストエディットの負荷は大きく異なってきます。発注者と受注者の間で、ポストエディット費として設定した単価で実現可能な品質はどこまでかを事前に合意しておかないと、納品後に「こんなはずじゃなかった」と感じることになりがちです。

逆に言えば、この部分で合意ができれば、機械翻訳とポストエディットを有効に活用できる可能性はあります。

機械翻訳は、単純に原文を投げ込めば理想的な翻訳を吐き出してくれる夢のようなシステムではありません。現時点では、「良い条件が揃えば、そこそこ満足できる翻訳を短時間で生成してくれるツール」と理解するのが正しいのではないでしょうか。この長所と短所を理解したうえで、うまくつきあっていければいいと思っています。実際、私は「アンチ機械翻訳」の立場をとりません。この件については、また別の記事で書くつもりです。


この記事が気に入ったらサポートをしてみませんか?