
機械翻訳はどこから来て、どこにいくのか──近刊『機械翻訳:歴史・技術・産業』訳者あとがき公開
2020年9月下旬発行予定、『機械翻訳:歴史・技術・産業』(ティエリー・ポイボー 著)の訳者、高橋聡氏による同書の「訳者あとがき」を、発行に先駆けて公開します。
***
『機械翻訳:歴史・技術・産業』訳者あとがき
文:高橋聡
機械翻訳(MT)、または自動翻訳。これまで数々の小説や漫画・アニメ、映画・ドラマに登場してきた夢の装置もしくはシステムです。本書の第1章に登場する「バベルフィッシュ」もそのひとつですし、『スター・ウォーズ』サーガに出てくるドロイド「C-3PO」は600万の言語を翻訳できることになっています。もっとも、日本人がいちばんよく知っている万能翻訳機といえば、きっと「ほんやくコンニャク」でしょう。
しかし、現実の世界でMTといえば、「大意(gist)はつかめることもあるが、たいていは珍妙で愉快な訳を出してくるシステム」という認識が一般的でした。それが、2016年にGoogleも採用したニューラル翻訳の登場で一変し、それ以来MTは社会的にも大きく注目されるようになっています。
さて、本書(原題は、ずばりMachine Translation)はそんな機械翻訳について概要をつかむのに格好の一冊です。MTに関する類書はすでに数多く出ていますが、本書でいちばんありがたいのは、数式が(ほとんど)出てこないこと。各種MT手法の原理を、数式に拠らず言葉だけで説明しています。専門家から見ると、やや冗長だったり舌足らずだったりする部分もありそうですが、私のような数学オンチにはありがたいアプローチです。そのうえで、MTの歴史が、第3~12章に適度な分量でまとめられています(第3章は通史)。この流れを読むと、MTが生まれた必然性から、各手法の基本概念と限界がよく分かります。ニューラル機械翻訳(NMT)が主流になった今となっては、もう今さらな情報と思えそうですが、今を知るうえで有用な歴史です。まず辞書とルールによる手法があり、その限界を超えるために統計的な考え方が生まれ、統計的手法をベースにしつつビッグデータの時代になってNMTが実現したという流れがよく分かるからです。たとえば、ヨーロッパ言語と日本語の間に大きな壁があるためか、日本ではMTの実用化も評価も遅れていましたが、なぜヨーロッパやカナダでは早くからMTが発達してきたか、その必然的な理由もよく理解できます。
ただし、出版年(2017年)の関係で、最新のNMTについてはぎりぎり間に合ったという程度です(第12章)。その後わずか2、3年のあいだにもNMTは著しく進化しており、つい最近もドイツ発のDeepLというサービスが始まって、大きな注目を集めているところです。そこで、第12章以降から現時点までのMT最新事情については、NMTの最前線に詳しい中澤敏明先生が解説を付けてくださいました。
本書の特長は、それだけではありません。そもそも「良い翻訳」と何なのかという根本的な問いかけから始まります(第2章)。私たち翻訳者にとっては自明の話なのですが、一般の読者にはMTの話に入る前に不可欠な導入になっています。産業としての使われ方や応用技術が現在どうなっているかという観点も(第14章)、特にこれから翻訳業界に入りたいと考えている人は知っておくとよさそうです。
機械翻訳という、古くて新しい技術を、技術面からだけではなく人間の言語活動の一環としてとらえ、かつ翻訳産業という視点も踏まえている点で、本書はかなりuniqueと言えます。
ところで、そうしたMTをめぐる日本の現状はどうかというと、残念ながらあまり良いとは言えません。MTには、いろいろな立場の人が関わっています。①MTの基礎を作る研究者、②基礎概念をシステム化して提供するプロバイダー、③MTをソリューションとして利用する一般企業や官公庁、④翻訳業務に取り込み、“効率化とコスト削減”をめざす翻訳会社、⑤私たち翻訳者です。今度こそ実用になると期待が高まっているせいなのか、残念ながら個々の関係者の意識や思惑がうまくかみ合っていない印象なのです。
まず、社会的にもいちばん目立つのが、MTの出力をそのまま公開し、とんでもない誤訳を世に送り出してしまう利用現場の問題です。そのたびに運用上の問題は指摘されますが、MTの限界を知らないせいか、知っていて人手や予算をかけられないからなのか、呆れるような事例が後を絶ちません。一般新聞・雑誌などの報道にも、姿勢が疑問視される内容が少なくない気がします。つい最近も、ある雑誌でDeepLの実力が紹介されましたが、出力例の出し方にかなり作為を感じました。作為ではなく単なる認識不足・取材不足なのかもしれませんが。
一方、翻訳会社はどこもMTの実地導入に必死です。翻訳業界における値下げ傾向はしばらく前から続いているので、MTはコスト削減の最後の切り札なのでしょう。国際的な競争を考えれば、それも当然の動きと理解はできます。そういう翻訳会社が翻訳者に発注する仕事では、ポストエディット(PE、第6章と第14章を参照)が増えています。
そうした状況に直面している私たち翻訳者の立場もさまざまです。MTによる“誤訳事件”が起こるたびに、翻訳者からはMT批判が噴出しますが、「だからMTなんてダメ」という議論はあまり意味がありません。研究者の皆さんは限界をよく分かっています。疑問を感じざるをえないのは、プロバイダーの売り方あたりからです。「精度95%以上」などという謳い文句もありますが、20個に1個も間違いがある翻訳など使いものになりません。でも、予算圧力に苦しみながらソリューションを利用する側は、その数字をほぼ100%と信じてしまうのでしょうか。翻訳会社のMT導入とPE推進にも、本筋をはき違えた例が散見されます。
なかには、自ら積極的にMTを導入する翻訳者もいます。PEについては、すでに実績のある翻訳者が難色を示す傾向もあるので、これからは新しい専門職として確立する可能性があります。ただし、その仕事に翻訳力、ましてや語学力が不要などということは断じてありえません。おそらく、指向性がまったく異なる新しい仕事になるのでしょう。さらには、MTの発展で翻訳者の仕事はなくなるのか、ということもたびたび話題になります。実際、MTの精度でかなりまでまかなえる種類の仕事が減っているのは確かです。もしかすると、PEの需要のほうが主流になる可能性もあります。それでも、最終的に翻訳者の仕事がなくなることは絶対にないはずです。
なぜなら、言葉には情報伝達という側面と、表現という側面があるからです。純粋に情報伝達しか必要ないのであれば、MTだけで済む時代がくるかもしれません。が、人はそこにさまざまな「表現」を加えたい生き物です。表現として使われる言葉のバリエーションは無限であり、MTがデータから学習あるいは推測できる範疇を軽々と超えています。文芸翻訳までいわなくても、ニュースですら(本書ではMT導入が容易な分野にあげられていますが)、ライターによる表現の個性は無限大です。これをMTが標準的にこなせるようになる日は、そうそう訪れないのではないでしょうか。
2045年にいわゆるシンギュラリティーが訪れる日には、そんな表現まで翻訳できるようになっているのかどうか――それはまだ誰にも分かりません。
高橋聡(たかはし・あきら)
翻訳家。日本翻訳連盟副会長。共著書に『できる翻訳者になるために プロフェッショナル4人が本気で教える翻訳のレッスン』(講談社,2016 年)などがある。
***
『機械翻訳:歴史・技術・産業』
ティエリー・ポイボー 著、高橋聡 訳、中澤敏明 解説
機械翻訳とは何なのか?
それはどこから来て、どこへいくのか?
近年、大幅な精度向上をとげ、生活に欠かせない技術になった「機械翻訳」(machine translation)。前世紀半ばから研究が続けられてきたその技術は、どう進化してきたのか。機械翻訳の方式にはどのようなものがあり、それぞれどんな特徴があるか。産業としての歩みと、そのキープレーヤーは。翻訳者は機械翻訳とどう付き合うか。精度をどう評価するか。そもそも翻訳とは何なのか――。
長年、機械翻訳研究の第一線を見てきた研究者が、非専門家にむけてコンパクトかつ包括的に解説。機械翻訳とよりよく付き合うために、その来歴・仕組み・これからを考える一冊。
国内の気鋭研究者による「ニューラル機械翻訳」に関する解説つき。
【目次】
第1章 はじめに
第2章 翻訳をめぐる諸問題
第3章 機械翻訳の歴史の概要
第4章 コンピューター登場以前
第5章 機械翻訳のはじまり:初期のルールベース翻訳
第6章 1966年のALPACレポートと、その影響
第7章 パラレルコーパスと文アラインメント
第8章 用例ベースの機械翻訳
第9章 統計的機械翻訳と単語アラインメント
第10章 セグメントベースの機械翻訳
第11章 統計的機械翻訳の課題と限界
第12章 ディープラーニングによる機械翻訳
第13章 機械翻訳の評価
第14章 産業としての機械翻訳:商用製品から無料サービスまで
第15章 結論として:機械翻訳の未来
解説:2020年時点でのニューラル機械翻訳(中澤敏明:東京大学特任講師)