機械翻訳、信頼して大丈夫?
私は産業翻訳者で主に和訳をしています。翻訳を始めたばかりのころは、ポストエディットという仕事もしていました。機械翻訳の出力を修正して翻訳者の訳文に「近付ける」仕事です。
このところ新しい機械翻訳が出てきて、「機械翻訳完璧!」みたいな話を読んだり、機械翻訳ではいい訳にならなかったから翻訳をという依頼をもらったりして、少々心配です。翻訳者以外は機械翻訳が完璧だと思っているのだなあと。
ポストエディットでは通常の翻訳校正と同じ作業をしますが、それよりも何倍も大変です。機械翻訳では、一見滑らかに見えてトンデモないミスが多いからです。ポストエディットの作業工程と機械翻訳のミスの例を挙げてみます。数字の順で作業するわけではないのでご了承ください。
工程① 原文訳文の数字チェック(致命的ミス多数!)
翻訳者はコピペや置換を使うのでミスが少ないですが、機械翻訳は類似文を出力するので、前のデータによっては数値が違うものを平気で出力します。
数値の違いは産業翻訳では致命的なミスです。
例)February 3→9月3日/2月6日 12.5 m→27.5 m
こういうミスは昔の機械翻訳ではなかったものですが、AIがそんなミスをするはずがないと思っている人が多いのでは。
工程② 訳抜けチェック(大打撃)
原文訳文を1文ごとに対訳にしてチェックしますが、分量が合わないところが出てきます。部分的に、また1文が丸ごとないこともあります。「訳抜け」です。
機械翻訳は、例文がないときにごっそりぬかすことがよくあります。不足分は訳しなおします。固有名詞や式が混ざる文、長い文などは脱落しがち。分からない(=例がない)文は「なかったもの」として出力。AIがそんなミスをするはずがないと思うでしょう? あるんですよ、それも結構頻繁に。
工程③ 固有名詞チェック(大打撃)
固有名詞は正確に訳せていないことが多いです。住所、役職なども要注意。
こういう語句が多い文書には機械翻訳は向いていないと感じています。
工程④ 対訳でクロスチェック、用語統一
機械翻訳は例文に引きずられるので、実は用語の統一が苦手。汎用エンジンだと確実にばらつくので、同じ用語を抽出して訳文のばらつきを置換で統一。普通の校正の100倍時間取ります。カスタマイズしてたら、3つに割れるくらいでしょうか(それでもひどい)。翻訳支援ツールというアプリケーションを駆使しないとなかなか対応できません。
工程⑤ 対訳でクロスチェック、表現
用語と同じく表現もばらつきます。10人の翻訳者の訳を合体して、同じ表現になるように修正していくようなもの。文ごとに主語が変わったり、受動と能動が一貫しないと読みにくいですから。翻訳支援ツールと自分の記憶力との戦いです。普通の翻訳校正だと翻訳者が表現を揃えているので、異なっている一部を見つけるだけですが、ポストエディットだと全部バラバラのこともあるので、大変です。
料金によって表現までは修正しない場合もありますが、読みにくいと理解しにくくなるので「分かりにくい」文章だと思われるでしょう。
工程⑥ 対訳でクロスチェック、肯定否定(致命的)
機械翻訳の最大の危険は、肯定否定のミス。
I am happy. / I am not happy. は、機械にとっては1語違うだけ。意味が逆かどうかより、分量だけで判断しているのですから。from/to など向きが逆の語句も危険です。「ONボタンを押す」「OFFボタンを押す」も、機械にとっては2文字の差です。
技術翻訳では生命を脅かす危険が生じます。
一定レベルの翻訳者の訳文では見られないミスがたくさんあるのが機械翻訳です。また、ミスが分かりにくい滑らかな文が出てくるようになりましたが、その分、信頼できない文が増えました。「疑いながら読む、個人使用にとどめる」という姿勢でないと危険です。
社会的に問題だと思う機械翻訳の使い方を挙げます。
1)行政が機械翻訳を使用する
→災害時、誤訳で命を落とすこともあります。また、言語でハンデがある人に間違った情報を届けることは行政の怠慢です。定型文、ウェブサイト、書類は翻訳者に依頼して正しく訳すべきです。
(現場の緊急対応で利用する場合も、リスクを知って注意しながら使用しなければなりません。)
2)顧客向けのコンテンツに機械翻訳を使用する
→向いていません。読み手がメッセージを受け取るための配慮は、機械翻訳にはできません。何かをアピールしたいなら、翻訳を依頼してください。
3)現場の注意書きに機械翻訳を使用する
→職場安全を脅かす恐れがあります。両方の言語と現場の作業や環境を知っている人が下訳として使うなら時短になるかもしれませんが、一から翻訳するより少し楽、という程度に思ったほうがいいです。また、現場用語はばらつく可能性が高いです。
4)単にコストカットのために機械翻訳を使用する
→安いエンジンだと出力もしかり。修正の手間、リスクも合わせて考えましょう。
5)自分の英語論文の作成に無料の機械翻訳を使用する
→未発表のデータが流出してもいいですか?
6)無知な翻訳者が無料の機械翻訳を使用する
→守秘義務違反です。翻訳会社がMTPEを行う場合は、専用エンジンをカスタマイズして使用、外部にデータが漏れないようにしています。登録先・エンドクライアントに訴えられますよ。
機械翻訳が向いているのは、こういう場面でしょうか。
・大体内容が分かっている自分宛てのメールをざっと理解するために
・研究者が他人の論文の内容を急いで知りたいとき
・社内文書の連絡や社内会議の資料を急ぎで訳す(質問できる環境だから)
マニュアル翻訳などに向いていると言われていますが、文書管理が甘くて過去のデータがない場合はリスクが高いです。過去のデータを提供して翻訳会社に依頼する方が賢明です。旧版を反映した翻訳になります。
エンジンにお金をかけてカスタマイズすれば固有名詞や部署名、用語などのミスは減ります。でもカスタマイズのための作業は必要です。ガチャガチャって原料を入れたら自動でポンっとすばらしい翻訳ができる!という幻想は捨ててください。ガチャガチャポンを謳って安価なエンジンを販売する会社が多いですが、一番大変なのは管理です。その人員はきちんと確保し、社内にリスクを周知徹底することをお勧めします。
毎日機械翻訳の出力を修正していたポストエディターの感想です。
滑らかさと致命的なミスがある機械翻訳。付き合い方については御一考くださいませ。