見出し画像

Google翻訳を試してみたら<1>

(日本語から英語、英語から日本語)

日本語と英語の自動翻訳は、他の言語間(たとえば英語とスペイン語など)よりかなり劣るとずっと思ってきた。実用的ではないな、と。特に英語から日本語への変換は意味をなさないことが多かった。ブラウザをChromeにしていると、ブラジルからのポルトガル語のメールなども、Gmailでは日本語にしてくれたりするが、それもかなーり酷かった。

ある時期、Google翻訳をつかっていると、他の提案訳語、候補はあるかと聞かれることがあった。それに協力すると機能がアップするのかなと思い、ときどき書き込んだりもしていた。AIの機械学習においては、多量の実際的なデータが必要になる。それが多ければ多いほど、AIの能力が高まるはず。日本語への翻訳能力が低かったのは、そのデータが少ない、つまり日本語をつかう人の協力度が低いのかな、と思ったりもしていた。もちろん基本的には、他の方法で大量のデータを入れ込んではいると思うが。

日本語と英語などヨーロッパ系の言葉は、語順が違ったり、ものごとの捉え方が違っていたり、その結果として言語間に距離ができているのも原因の一つではあると思う。

と、思っていたら、いつの間にか、Googleの日本語↔英語の翻訳能力が画期的に高まっていることに気づいた。きっかけはあるサイトに記事を寄稿したとき、取材相手(ドイツ人)から「記事を読むのを楽しみにしている」と言われて、「いや、残念ながら日本語なんですけど」と返したところ、「Google Translateで読むから大丈夫」と言われたこと。いや、あれはダメでしょ、日本語の場合、と返そうとして、試しに自分の書いた原稿をGoogle Translateに投げ込んでみた。

相手はドイツ人だったけれど、英語でやり取りしていたので、翻訳先の言葉は英語を選んだ。ドイツ語はできないので、ドイツ語では翻訳の精度は確認ができない。それが、、、、なんか、、、良かった!! 素晴らしいといってもいいくらいの訳だった。えっ、こんなに進歩してたの??? という感じだ。たとえばこんな風。

Google 英語訳:
The exhibition "RE: ECM", celebrating the 50th anniversary of ECM Records, and the sound installation "Small Places", one of its contents, are currently in progress in Seoul, Korea. It starts at 12:00 on October 18 and ends on February 29 next year. You can experience the same sound on the net simultaneously with the Storage by Hyundai Card in Seoul, and listen to all ECM albums in real time streaming.
原文はこれ:
韓国・ソウルで進行中の、ECMレコード50周年を祝うエキジビション「RE: ECM」とそのコンテンツの一つであるサウンド・インスタレーション「Small Places」。10月18日12時にスタートし、来年2月29日に終了します。ソウルの会場ストレージ・バイ・ヒュンダイ・カードと同時進行でネットでも同じ音の体験ができ、ECMのすべてのアルバムをリアルタイム・ストリーミングで聴くことができます。

完璧じゃないでしょうか? 訳としても英語としても。言ってることが誤りなく通じてる。この文章は事務的な文なので、訳しやすいということがあるかもしれない。ただ文の構造はまったく単純というわけでもない。

しかし全文を訳してみると、いくつか間違った訳文もあった。たとえば:

It's almost like that, but it's a bit like Steve Reich. Examining Marx Stockhausen, it appears that there is a trumpet player and composer born in Germany in 1957, who plays music between jazz and chamber music and opera. The latter also has a lot of collaboration with his father.

この太字の部分は、日本語では「マルクス・シュトックハウゼンを調べてみると、1957年ドイツ生まれのトランペット奏者、作曲家とあって」である。「he is a trumpet player…」の方がいいと思う。多分「とあって」というのを「there is」と訳したのだろう。それと固有名詞、ここでは3人の名前が出てくるが、スティーヴ・ライヒとシュトックハウゼンのつづりはOK、でも息子のマルクス・シュトックハウゼンはまだデータに載っていないようで、マルクスは「Marx」になっていた。実際はMarkus。

つづきをJournalで読む(残り約3500字)

この記事が気に入ったらサポートをしてみませんか?