見出し画像

関連記事:
翻訳者じゃない人にAI翻訳の修正がいかに苦痛か説明するよっ!
翻訳者じゃない人に向けて、翻訳発注の側面から、人力翻訳、AI翻訳のみ、AI翻訳+人力修正の違いについて話すよっ!

こんにちは。翻訳ジャーニーです。プロの翻訳者とそうでない方の間に、翻訳やらAIやらに対する認識がものっそい乖離しているので、ちょっとメモがてら書こうと思います。

次のツイートをしたところ、ほんの少しだけ話題にしてもらえました。1日でだいたい6万ビュー、500リポスト、1.5万いいね、くらいです。

なかにはこういう反応もありました。

うむ。なるほど、と思いました。そこで、29億円の資金調達と、人工知能・ニューラル機械翻訳と、漫画などのハイコンテクスト翻訳について書いてみようと思います。

Google翻訳、DeepL、ChatGPTの開発費

ニューラル機械翻訳(NMT)が出てきたときに、その流ちょうさには世界中が驚きましたよね。これは翻訳の未来だー!ってな具合で。最近ではLLM(大規模言語モデル)なるしくみも機械翻訳の世界に入ってきてニュースになっています。

Google、DeepL、ChatGPT(これは翻訳専門ではありませんが)などは文字通り毎日進歩し続けて、どんどん性能を上げています。はたして、これまでにいくらの資金がぶち込まれたのか、私は専門家でないので存じ上げないのですが、小国の国家予算を超える言われても驚きはしません。29億円など鼻くそレベルだと思います。

で、商用レベルになってるの?

お金と技術を注ぎ込んだ前述の機械翻訳(以下「MT」)ですが、商用レベルになっているかというと、まだまです。一部の分野(後述)では使い物になっているようですけど。

ここで言う商用レベルには2つの意味があって、機械翻訳にかければ売り物自体が出てくる、または売り物に付随するドキュメントが出てくる、というものです。界隈ではこれを raw MT(生の機械翻訳出力)と言います。どの分野でもこれは無理無理の無理です。

もう1つの意味は、許容できるレベルの負荷の範囲で人間が手直しした場合に売り物や売り物の付属物になれるか、というものです。MT出力を人間が手直しすることをポストエディット/ポストエディティングといって、頭文字を取ってPEと呼びます。MTとPEを合わせて「MTPE」と言う場合もあります。それに対して、ゼロから人間が翻訳することをHuman translation = HTと呼びます。

「許容できるレベルの負荷の範囲で人間が手直しした場合に」については、別の記事で詳しく書くかもしれません。

ちょっと遠回りしましたが、Google translate、DeepL、ChatGPT、そのほか企業が内部で作っている特化型MTエンジンが翻訳し、人間がPEをして商用レベルになっているのは、メディカル系の一部と特許の一部のようです。これらに共通するのは、過去のデータが大量にあり、原文も訳文も書き方にはっきりとした型があり、全体のフォーマットが共通している、そんなところだと思います。企業ごとの個性とか、喜怒哀楽とか、ましてはジョークなど出てこないはずです。

上記に挙げたごく一部のジャンルを除いて、産業翻訳/実務翻訳と呼ばれるビジネス系一般のドキュメントでさえ、莫大な資金を投入したMTは"商用"レベルにはなっていません。もちろんジョークなんかほぼでてきませんよ。

(話はそれますが、PE作業者に支払う額をHTと同じにすれば許容可能な負荷にはなりますけどね。仮にPE作業がHTの3割引きだとすると、PE作業者とHT作業者が同じ金額をゲットするためには、PE作業者はHT作業者の1.3倍の速度=量をこなさないといけません。現状のMTは、1.3倍のブーストをかけてくれるほどの品質にはなっていません。ややこしいこと書きますけど、ISOの基準によるとMTPEで求められる品質はHTのそれと同じです。MTPEだから人間翻訳より雑で良いというのは(少なくともISO基準では)認められません。あと、翻訳者でHTの仕事でスケジュールが埋まっている人は、わざわざPEの仕事を受けません。割りに合わないからです。(前述する一部の分野を除いて)PEの作業を受けるのはHTでスケジュールが埋まらない人じゃないかと思っています)

ハイコンテクストな翻訳

めっちゃ遠回りしました。

莫大な資金をつぎ込んだ、有名なニューラル機械翻訳勢ですが、限られた分野でしか「商用レベル」にはなっていないのが現状です。

さて、翻って見てみましょう。大手MT勢力からすれば鼻くそレベルの29億円の出資を受けた会社が、必ずしもMTエンジンの開発に29億円すべてをぶち込めるわけでもない状況で、大手の外資MTプレイヤーたちでも太刀打ちできない漫画というハイコンテクストな翻訳に特化したMTを開発して、商用レベルになると思いますか?

普通ならんやろ?

いや、未来のことは誰にもわかりません。ひょっとしたらなるかもしれません。そうなれば、万々歳ですね。日本の漫画カルチャーがたくさん輸出できてみんなハッピーになるでしょう。しらんけど。

AIの尻拭いをさせられて熟練者への道を閉ざされる新人

別の問題も書きます。一般に、Google 翻訳は無料で使えるのでAI翻訳は安いと思われています。しかし、企業が契約して使うMTエンジンは結構お高いと聞きます(これは数年前に私が外資系の大きな翻訳会社にいたときの話なので、現状ではまた話が変わっているかもしれませんが)。MTエンジンにお金を払いつつ、十分にペイする単価がHTの2~4割引きなんでしょうか。

上でも少し書きましたけど、(MTPEモデルが成功している一部のジャンルを除いて)HT翻訳だけをやって生計を立てられている翻訳者は、好んでPEの仕事を請けません。言語的な苦痛(これについても別の記事を書くかも)があるほかにも、普通の翻訳よりも収入が下がるからです。MT出力をちゃんと直してHTレベルに引き上げつつ、HTより1.25~1.66倍のスピードを出すのは無理っす。

またまた余談ですけど、MTPEの最終アウトプットは、HTの最終アウトプットと比べて、ISOの公的なお達しとは裏腹に一般的には低品質になります。でも、これって当然ですよね?MTPEモデルを採用した方が、HTモデルよりも安く上がるのが普通です。安くて品質が良いなら世界中の翻訳がすべてMTPEになっているはずです。そうならずに、一部がMTPEに、一部がHTのまま、という現状になっているのは(くどいようですが特定のジャンルを除いて)コストと品質のバランスを考えた結果ですよね。つまり、MTPEを導入する翻訳は一般に品質に求める基準が低めで、HTを使い続ける翻訳はコンテンツタイプが特殊か品質に求める基準が高いかのどちらかです。(いや、20言語くらいを扱うプロジェクトだと別の理由もありますけど、ややこしいのでここでは触れません)

じゃあ誰がPEの作業をしているかって、HTの仕事でスケジュールが埋まらない人ですよ。たとえば経歴の浅い新人翻訳者とか。そして新人翻訳者がPEをやり続けても、HTは上手になりません。上手にならないどころか、下手になると思います。業界内の人材が育ちません。

MTPEをやっていても翻訳の力がつかないということ、翻訳者じゃない人たちにもぜひ読んでいただきたいですね。同じような疑問を抱いた方から質問をもらいました。

これに対するリプライを下に並べます。

いや、わかりますよ。短期的なビジネスとして考えれば、業界の新人が育たないとかはどうでもよいですよね。ビジネスなんですから。

だけど、そうであれば少なくとも「日本の文化を世界に発信する」みたいなきれい事とセットにはしてくれるなと言いたいんですよ。

漫画というキング・オブ・ハイコンテクストなMTが最も苦手とするジャンルで、クリエイティブな翻訳という仕事を目指す新人を安く使って、負荷をかけて、技術の上達にもならない構造に必然的になるMTPEを導入しておいて、何が文化なんですかね?

寝言は寝て言ってほしいし、きれい事は身辺をきれいにしてから言っていただけますでしょうか何卒よろしくお願いいたします。

今日のところはこのへんで。アディオース!

関連記事:
翻訳者じゃない人にAI翻訳の修正がいかに苦痛か説明するよっ!


この記事が気に入ったらサポートをしてみませんか?