見出し画像

あと3年もすれば翻訳はAIで十分、を検証

こんにちは、Choimirai School のサンミンです。

【主要な変更内容】
(2020.05.31)DeepL社の個人情報に関する規定を追加
(2020.05.27)2022年までに起きること、を追加
(2020.05.27)英訳の詳細を追加

0  はじめに

2019年の5月にあと3年もすれば、翻訳はAIで十分というツイートをしたことがあります。

翻訳の仕事をバカにするなという批判も多かったのですが、早いことでそれから1年。

暦本先生が指摘されているように機械翻訳のような破壊的テクノロジーは「〜の仕事を馬鹿にするな」と言いたくなる局面まで来ていると言えます。

今回の note では最新の翻訳事情をシェアさせていただきます。

1  「DeepL(ディープ・エル)」 が日本語と中国語に対応

2020年2月に機械翻訳に置いて新たなブレークスルーを達成したと発表したのが「DeepL」です。

3月19日には同翻訳エンジンに日本語と中国語も追加。

下の図は機械翻訳の結果を専門の翻訳家に評価してもらったスコアです。他のサービスと比べると圧倒的に高い精度を誇ってます。

画像1

2  翻訳の実例

日本語 ⇄ 英語の翻訳に関しては、「みらい翻訳」がグーグルをはるかに超えていますので、今回は「DeepL」と「みらい翻訳」の例を比べます。

翻訳の原文はアトランティック誌が5月20日に掲載したこちらの記事からです。

This pattern exists because different states have experienced the coronavirus pandemic in very different ways. In the most severely pummeled places, like New York and New Jersey, COVID-19 is waning. In Texas and North Carolina, it is still taking off. In Oregon and South Carolina, it is holding steady. These trends average into a national plateau, but each state’s pattern is distinct. Currently, Hawaii’s looks like a child’s drawing of a mountain. Minnesota’s looks like the tip of a hockey stick. Maine’s looks like a (two-humped) camel. The U.S. is dealing with a patchwork pandemic.

3  みらい翻訳

このパターンが存在するのは、コロナウイルスの世界的流行を経験した州が異なるためである。ニューヨークやニュージャージーのような最もひどい被害を受けた地域では、COVID-19は衰えつつある。テキサスとノースカロライナでは、それはまだ離陸しています。オレゴンとサウスカロライナでは、それは安定しています。これらの傾向は平均して全国的に停滞しているが、各州のパターンは異なっている。現在、ハワイの絵は子供が描いた山の絵のように見えます。ミネソタはホッケースティックの先端のように見える。メーンの姿はラクダに似ている。アメリカはつぎはぎの世界的大流行に対処している。

4  DeepL

このようなパターンがあるのは、州によってコロナウイルスのパンデミックの経験が全く異なるからです。ニューヨークやニュージャージーのような最も深刻な被害を受けた場所では、COVID-19は衰退しています。テキサス州やノースカロライナ州では、COVID-19の流行はまだ続いています。オレゴンとサウスカロライナでは、それは安定している。これらの傾向は、平均して全国的なプラトーになっていますが、各州のパターンは、はっきりとしています。現在のハワイ州は、子供が描いた山の絵のように見えますが、ミネソタ州は、子供が描いた山の絵のように見えます。ミネソタ州はホッケーの棒の先のように見えます。メイン州はラクダのように見えます。アメリカはパッチワークのパンデミックに対処している。

※注意:2020年5月31日の時点で日本で利用できるのは無料版のみです。無料版の場合、翻訳対象のテキストがDeepL側に保存されるとのことですので守秘義務がある書類の場合は別の方法を検討してください。

画像5

5  使い勝手

みらい翻訳を使うとみらい翻訳のサイト内に翻訳するテキストを貼り付けるのに最大2,000文字までと、手間がかかる。一方で、DeepLは無料版ですと5,000文字まで翻訳することが出来ます。

また、DeepLの場合、専用のアプリ(無料)をダウンロードしますとMacでは「Command+C」を、Windowsでは「Ctrl+C」を2回押すことで、ポップアップの画面が現れ、翻訳された文章を確認することもできます。

画像2

Mac用のアプリは下記のリンクからダウンロードしてください。

6  英訳

「知的生産の技術」の紹介文から。

学校では知識は教えるけれど知識の獲得のしかたはあまり教えてくれない.メモのとり方,カードの利用法,原稿の書き方など基本的技術の訓練不足が研究能力の低下をもたらすと考える著者は,長年にわたる模索の体験と共同討論の中から確信をえて,創造的な知的生産を行なうための実践的技術についての提案を試みる.

▼グーグル翻訳

Although the school teaches knowledge, it does not teach us how to acquire knowledge. Authors who believe that lack of training in basic skills such as how to take notes, how to use cards, and how to write manuscripts will lead to a decline in research ability. I will try to propose a practical technique for conducting static production.

▼みらい翻訳

Schools teach knowledge, but they don't teach much about how to acquire knowledge. The author who thinks that the lack of training of basic technology such as how to take memos, how to use cards, and how to write manuscripts brings about the lowering of the research ability tries to propose the practical technology for carrying out the creative intelligent production from the experience of groping for many years and the joint discussion.

▼DeepL

Schools teach knowledge, but they don't teach you how to acquire it. The author believes that a lack of training in basic skills such as note-taking, card use, and manuscript writing can lead to a decline in research ability, and after many years of searching and collaborative discussions, he attempts to propose practical techniques for creative intellectual production, which he is convinced of.

DeepLの場合、アプリがインストールされていれば、英訳のテキストを言い換えるのも簡単です。方法は下記のツイートを参考にしてください。

7  2022年まで起きること

機械翻訳の現状を知るベストな方法は毎年開かれているWMTイベントを確認することです。世界有数の機械翻訳関連企業や研究機関が参加し、性能を競いあったり、最新の研究成果をシェアするイベントです。

画像3

去年開催されたWMT19では初めて、センテンスレベルではなくドキュメントレベルでの翻訳をタスクのゴールとして策定したのも注目したいポイントです。

画像4

文レベルでの翻訳は全体のコンテクストからずれる場合も多い。一方で、文書レベルでの翻訳が可能となると今までよりさらに精度の高い翻訳が期待できます。

文書レベルでの翻訳が可能となると
今までよりさらに精度の高い翻訳が期待できる

文書レベルでの翻訳は今年の WMT でも評価される予定となっています。

Facebook のAIチームもこれからドキュメントレベルでの翻訳に力を注ぐという発表をされてます。

8  まとめ

改めて驚くのは「去年の5月の時点であと3年もすれば翻訳はAIで十分」というツイートをしたのですが、わずか1年間でより大きな進化がもたされているということです。

上記の比較でもわかるように、「DeepL」で2箇所くらい改善が必要なポイントもあったのですが、最初のセンテンスの結果を見ても「みらい翻訳」より高い精度で翻訳出来ていると言えます。

■最初のセンテンス:This pattern exists because different states have experienced the coronavirus pandemic in very different ways.

▼みらい翻訳

このパターンが存在するのは、コロナウイルスの世界的流行を経験した州が異なるためである。

▼DeepL

このようなパターンがあるのは、州によってコロナウイルスのパンデミックの経験が全く異なるからです。

こうした技術やツールの動向は定期的にアップデートする必要があると痛感しています。このペースですと、間違いないと思います。2年もすれば、翻訳はAIで十分。これからは職業にこだわらず、個人の力を強化することが本当に重要です。


この記事が気に入ったらサポートをしてみませんか?