見出し画像

(F59) 「Google翻訳」を超えた次世代の「DeepL翻訳」とは?! (2020.6.3) by Honey Waffle より抜粋加筆しました。

⑴ DeepL翻訳とはDeepL社が提供している最先
端のニューラルネットワーク技術を駆使して開発された、超高性能な機械翻訳システム

DeepL社は、
小さな訳文検索エンジン会社Lingueeを前身としている、ドイツのスタートアップ会社です。

2017年8月にDeepL翻訳を公開し、
2020年3月19日に、ついに日本語と中国語にも対応しました。


⑵ DeepL翻訳はどの言語に対応している?

2020年5月現在では、
以下の11ヶ国語の翻訳が可能で、110の組み合わせ(11×10)が可能です。

DeepL社としては”量より質”を掲げており、今後、順次追加していく予定だそうです。


⑶ DeepL翻訳精度が高い理由は主に2つだと言われている

①高精度な対訳データ

現在の機械翻訳は、
人間が翻訳のルールを教え込むのではなく、「統計的手法を用いる」のが主流です。

教師データである大量の対訳データを読み込ませることで、コンピュータが翻訳のルールを自動的に獲得し、各ルールの重要度を統計的に推定します。


そこで、翻訳の精度を決める重要なパラメータのひとつとして、「対訳データの精度」があります。

間違った参考書で勉強しても成績が上がらないのと同じで、対訳データの精度が高くないと翻訳精度も高まりません。


DeepL社は「数十億の高精度な対訳データ」を持っています。
それが、高精度であるひとつの要因です。


②2つ目はニューラルネットワーク技術が優れているということ

ニューラルネットワークとは簡単に言うと、
「入力層」「中間層」「出力層」の構造をもつものを指します。

ちなみに、ディープラーニングとは、
「中間層」を2層以上に深く(ディープ)したものを指します。


つまり、ディープラーニングは、
ニューラルネットワークの一種で、中間層が複数あるため、特別にディープラーニングと呼ばれています。

そのニューラルネットワークは、
様々な組み合わせが考案されており、画像処理、自然言語処理など用途に合わせて使われています。


DeepL社は、これまでにない組み合わせを考案し、以下が高精度の要因と言っています。
「新しいニューラルネットワークを開発した」


⑷ こなれた日本語はちゃんと訳せるのか、を検証する

DeepL翻訳はいずれも正しく訳せていることが分かります。
「やべえ」→Oh,man
「めっちゃ刺さっている」→It’s stinging
「仲間割れ」→It’s a spilit
「完全に迷子や」→I’m completely lost


こなれた日本語も、ナチュラルな日本語に訳せているだけでなく、細かな意味、ニュアンスも正確に訳せています。

DeepL翻訳はVPNを必要としません。
中国ではここがGoodです。

私は上海在住11年目。 2020年2月、在中国日系企業を対象とする、 「⺟国語で現場情報を引き出す、社内コミュニケーションツール」 を無料リリースしました。 コラボしたい方、ぜひお待ちしております。 bigluck777r7@yahoo.co.jp