見出し画像

Google翻訳を超えた?最近DeepL翻訳が話題に

今回のポイント

・DeepL翻訳が精度が高いと話題に
・Google翻訳よりも優れている(自称)
・いくつかの文でGoogleとDeepLを比較

DeepL(ディープエル)翻訳とは

ドイツのDeepL社が開発した機械翻訳システム。2017年からサービスはあったらしいのですが日本語に対応していませんでした。それが2020年の3月についに日本語に対応し,話題となっています。

DeepLの公式サイトによると,翻訳システムの名を伏せた状態でテストを行ったところ他を圧倒してよい評価を得られたとのこと。日本語はサービスを開始したばかりなのでテスト結果は書いてありませんけどね。

今回はGoogle翻訳DeepL翻訳に同じ文章(日本語・英語)を打ち込み,日本語においてもDeepLが優れているのか主観的に検証してみようと思います。(英語の専門家ではありませんが...)

英訳(日本語 ⇒ 英語)を試してみた

試してみた文章は3つです。それぞれ特性の異なる文章を入力することで違いを見ていきたいと思います!

英訳➀(小説)

例文
メロスは激怒した。必ず、かの邪智暴虐の王を除かなければならぬと決意した。
Google翻訳
Melos was furious. I decided that I had to get rid of that wicked violent king.
DeepL翻訳
Melos was enraged. He decided that he had to get rid of the king of evil, wisdom and tyranny.

さて,例文を提示しておいて邪知暴虐の正確な訳は分からないですが(笑),そこは両者とも何となくは訳せていそうな気がします。やはりDeepL翻訳の方が自然な英文っぽいですね。

しかし他に1つ大きな違いが見てわかると思います。2文目の主語ですよね!日本語は主語が省略されることの多い厄介な言語です。この文章の場合決意したのはメロスです。語り手ではありません。

DeepL翻訳はそこを汲み取りちゃんと"He"と訳しています。一方Google翻訳は"I"と訳してしまってますね。

このことから英訳➀はDeepL翻訳の勝ち!

英訳➁(論文)

例文
図1に機械翻訳システムの定量評価の結果を示す。
Google翻訳
Figure 1 shows the results of the quantitative evaluation of the machine translation system.
DeepL翻訳
The results of the quantitative evaluation of the machine translation system are shown in Figure 1.

この文はよく論文で用いられる表現ですね。英語の論文だとFigure 1 shows ~の方がよく用いられていると思います。

DeepL翻訳はちょっと主語が長くなってしまってますね。一方Google翻訳はよくあるスタイルに訳されています。

このことから英訳➁はGoogle翻訳の勝ち!

英訳➂(早口言葉)

例文
にわにはにわにわとりがいる。
Google翻訳
The crocodile has a crocodile.
DeepL翻訳
There is a chicken in every garden.

漢字だと簡単だと思うので敢えてひらがなで入力してみました。直訳すると"There are two chickens in the garden."ってところですかね。

Google翻訳はもはやニワトリの影もなくなっています。crocodileなのでワニですね笑。DeepL翻訳は庭にニワトリがいるところまで訳せています!かなりおしいですが2羽を表現できていないので完璧ではありません。

完璧ではありませんが本来の訳に近いのでDeepLの勝ち!

和訳(英語 ⇒ 日本語)を試してみた

こちらも特性の異なる2つの文章を入力して比較していきます。早口言葉は英語だと翻訳できそうなのでカットします。

和訳➀(小説)

例文
To Sherlock Holmes she is always THE woman. I have seldom heard him mention her under any other name.
Google翻訳
シャーロックホームズにとって、彼女は常に女性です。 彼が他の名前で彼女に言及するのを聞いたことはほとんどない。
DeepL翻訳
シャーロック・ホームズにとって 彼女は常に女性だ 他の名前で彼女のことを言うのは ほとんど聞いたことがない
和訳例
シャーロックホームズにとって、彼女はいつも「あの女」である。別の呼び方をするのは、これまでほとんど聞いたことがない。
参照:https://221b.jp/h/scan.html

シャーロックホームズから例文を持ってきました。やはり小説は直訳では読み取れない部分があるため難しいところもあるかと思います。

今回に関しては特に違いが見られなかったので引き分け!

和訳➁(論文)

例文
The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration.
参照:https://arxiv.org/abs/1706.03762
Google翻訳
支配的なシーケンス変換モデルは、エンコーダー/デコーダー構成の複雑なリカレントまたは畳み込みニューラルネットワークに基づいています。
DeepL翻訳
主なシーケンス伝達モデルは、エンコーダ-デコーダ構成の複雑な再帰ニューラルネットワークまたは畳み込みニューラルネットワークに基づいています。

例文は"Attention is All You Need"という面白いタイトルの論文から持ってきました。深層学習系では結構有名とのことです。

"dominant"の訳が分かれていますが,個人的には「主な」の方が自然だと感じています。

また,英文で"recurrent or convolutional neural networks"とありますが,これはよくRNN (Recurrent Neural Network)とCNN (Convolutional Neural Network)と略されるものを指しています。そのため,直訳すると「リカレントまたは畳み込みニューラルネットワーク」なのですが,略称のことも考慮すると「再帰ニューラルネットワークまたは畳み込みニューラルネットワーク」の方が分かりやすいと個人的には思います。

本質的にはどちらの翻訳も正しいようには思えますが,私はDeepLの訳の方が好きです。よってDeepL翻訳の勝ち!

まとめ

DeepL翻訳の方がやや自然な訳になっている!

結果は3勝1敗1分けでDeepL翻訳の勝利となりました。これはあくまで個人の見解ですが,現状ではやはりDeepL翻訳の精度の高さは嘘ではなさそうです。どの機械翻訳システムにせよ更なる競争でもっと精度が向上すると嬉しいですね!

おまけ  PDFの改行を削除して翻訳する方法

PDFの文章をコピーして貼り付けると改行が入ってしまい,機械翻訳の正確性に影響が出てしまいます。それを避けるには以下の手順で行えます。

1. コピーしたい文章をドラッグして選択

2. コピー(Ctrl + c)

3. URLの入力欄に貼り付け (Ctrl + v)

4. 全て選択し,切り取り (Ctrl + a ⇒ Ctrl + x)

5. 翻訳サイトの入力欄に貼り付け (Ctrl + v)

ショートカットキーを使うと素早くできます。DeepLの無料版は5000字までなので長文の場合はこまめにコピペする必要があるので注意しましょう。

この記事が気に入ったらサポートをしてみませんか?