Libra：最近の翻訳ツールの雑多な所感

2020年6月20日 21:32

▼テック短信
　エセー『Libra』は，並行しているシリーズ『The Independent Think』よりもカジュアルなスタイルのシリーズ．今回は，テクノロジー関連から，筆者が普段使っている自動翻訳ツールがテーマ．

　自動翻訳ツールといえば最近，日本でもDeepLの有料版である「DeepL Pro」の提供が始まったことで話題になった．それにも関連する本稿は，筆者がDeepLの無料版と「みらい翻訳」の無料トライアル版を利用してみた雑多な所感である．

◇自動翻訳ツールの精度

　先ず，以下の記事を読んでみてほしい（目を通すことを強くおすすめする．その方が，より分かりやすいだろう）．本稿のタグに「 #経済 」がついているのは，これが理由だ．なお，本稿は別に経済について語る予定はない．さらに言えば，この記事を選んだ特段の理由もない．だが，記事の内容自体はとても参考になるので，おすすめする．

　この記事は，ハーバード大学教授ジェフリー・フランケル（Jeffrey Frankel）のProject Syndicate誌への寄稿記事だ．タイトルは，そのまま直訳すれば「不況とは何か？」（What’s in a Recession?）である．
　次に，以下の文章は，自動翻訳ツールである「DeepL」の無料版と，「みらい翻訳」の無料トライアル版，この二つに加えて，補助的に「Google翻訳」を用いた，上記の記事の翻訳文である（筆者による表現の変更や漢字表記の見直しなどは多少あるが）．ただ，Google翻訳を用いた箇所は少ないため，基本的にはそれ以外の二つを用いて翻訳したと考えていい．

What’s in a Recession?［不況とは何か？］
［Cambridge 6月15日，Project Syndicate by Jeffrey Frankel］
　6月8日，全米経済研究所（NBER）の景気循環日付委員会（Business Cycle Dating Committee）は，正式にリセッションの開始を宣言した．しかし，その日の前後にリセッションが始まっている可能性が高いことはすでに分かっていた．では，なぜNBERの正式な宣言が必要なのだろうか？
　雇用の指標が2月から3月にかけて急激に低下したことは周知の通りである．実質（インフレ調整後）個人消費支出（PCE）と実質個人所得（移転前）も2月にピークを迎えた．GDPの公式指標は四半期ごとにしか発表されないが，3月下旬の経済の急降下は，第1四半期のGDP成長率を年率換算でマイナス4.8％（2019年最終四半期比）に引き下げるのに十分であった．　NBERのは民間の非営利研究機関であるが，その年表は米国務省の経済分析局（BEA）によって確認された公式のステータスを保持している．景気サイクル日付委員会が米国経済のターニングポイントを宣言するたびに，「なぜこれほど時間がかかったのだろうか」と不思議に思う人がいる．しかし，このイベントと委員会の最新の宣言との間の4ヶ月間のタイムラグは，1978年の設立以来，最も短いものであった．1980年以降の米国経済の循環的ターニングポイント10回の平均的なタイムラグは11.7ヶ月であった．今回の委員会の相対的な速さは，パンデミックに起因する崩壊が前例のない突然のものであったことを物語っている．
　読者は，米国の景気後退を宣言するのが，さまざまな指標を検討するエコノミストの委員会に委ねられていることを知ってしばしば驚く．他の先進国の多くは，単にGDP成長率が2四半期連続でマイナスになることをリセッションと定義している．しかし，4分の2ルールを超えているのは米国だけではない．日本政府は公式の景気サイクル年表でも他の指標を考慮している．また，ユーロ圏やカナダ，スペイン，ブラジルなど他の国の民間委員会は，メディアや政府の公式機関からはそれほど注目されていないが，より広範囲な経済指標を見て景気サイクルの日付を決定している．
　いずれにしても，「なぜラグがあるのか」と「なぜ4分の2ルールではないのか」という二つの批判は，互いに対立する傾向がある．GDP統計は常に遅れて収集され，その後に修正される（特に毎年7月にBEAが国民所得・製品勘定を更新するとき）．したがって，GDPの数字だけを頼りにしていると，実際に景気後退が始まってから正式に指定されるまでにさらに時間を要することになりかねない．
　NBERの最新の宣言は，GDPルールから解放されることがいかに役立つかを示す一例である．2020年第2四半期のデータでは，第1四半期のデータよりもさらに大きな（年率換算でおそらく40％の）米国生産高の急落を示すと確信できる．しかし，この第2四半期のマイナス成長が検証されるのは7月30日のBEAのアップデートまでである．そして，その数字でさえも先進的な予測に過ぎないのである．
　景気サイクルをどのようなレンズを通して見るかで，時間の経過とともに大きな違いが出てくる．2001年のGDP成長率が4分の2のマイナス成長が連続していなかったにも拘らず，NBERが2001年に景気後退があったと定義したことに疑問を持つ人は少ないだろう．同様に，最近までの米国の景気拡大は，1991年3月から2001年3月までの10年間（120ヶ月）が最長であったことは誰もが認めている．2001年の第2四半期のマイナス成長が連続していなかったために，実際には2007年12月（201ヶ月）まで続いたと主張しようとする人はいない．もしそうだとすれば，完了したばかりの128ヶ月間の拡大（2009年6月から2020年2月まで）は，米国史上最長の景気拡大であるという主張を失うことになる．
　NBERのレンズは，いわゆる大不況の年表においても重要な意味を持っていた．委員会が2007年12月をピークに景気後退が始まったと宣言したとき，米国政府の試算では，2008年の第1四半期と第2四半期の公式GDPはともに2007年の最終四半期を上回っていたのである．NBERの景気後退の開始の発表は，長らく遅れていたとして歓迎された．しかし，もしNBERが4分の2ルールを適用していたとすれば，BEAによる重要なデータのアップデートをさらに1年半待たなければならなかっただろう．
　NBERのあまり機械的ではないアプローチと比較して，4分の2ルールには長所と短所がある．メリットの一つは，単純で透明性であり，自動化された手続きは，選出されていない，説明責任のないアカデミック・エコノミストの委員会の裁定よりも客観的に見えることができる．しかし，大きな決定は，GDP統計がその後の修正の対象となる限り，循環的転換点の遡及修正が必要となる可能性があることである．
　例えば，英国の2011-12年の「景気後退」は，その後，2013年6月に公式のGDP数値がアップデートされた際に記録から抹消された．政治家や研究者などが2012年に「景気後退」を主張していたことは，その時点では善意で発表されていたにも拘らず，すべて虚偽のものとなってしまったのである．
　このような理由から，NBERは谷やピークの日付をつける前に，すでに公式な年表に日付が入った後で，将来的に修正する必要がないと合理的に確信できるまで待っている．他にも，今回のようなリセッションの確率をリアルタイムで評価しようとしているオブザーバーはすでに沢山いる．NBERの優先事項は，最速ではなく，決定的なものであることだ．

＜筆者について[1]＞
　ジェフリー・フランケル（Jeffrey Frankel）は，ハーバード大学教授（資本形成・成長学）であり，クリントン政権時には大統領経済諮問委員会の委員を務めた．米国立経済研究所の研究員であり，景気循環日付委員会の委員でもある．貿易理論の大家として知られる．

[1]日本経済新聞出版，https://nikkeibook.nikkeibp.co.jp/author/69100（2020年6月19日）

◇翻訳の所感

　「DeepL」と「みらい翻訳」を用いた翻訳の精度について，筆者が実際に翻訳してみた所感としては，興味深い点があった．
　先ず，DeepLに関しては，約3ヶ月ほど利用してきたので，こちらの翻訳精度については，多少は体験している．その体験には，翻訳の欠陥や精度の低い部分という意味合いも含まれる．
　例えば，DeepLで翻訳した場合，英語の文章内であれば「－（ハイフン）」で囲まれた文章を翻訳すると，ひとつの文章としての整合性が，ハイフンがない状態よりも低くなる場合がある．他にも，「：（コロン）」や「；（セミコロン）」を用いて記述した文章の場合でも，翻訳精度が著しく低下したり，あるいはそれ以降の翻訳が無視されてしまう場合がある．
　もちろん，ライターの書き方にも大きく左右される．DeepLで翻訳する場合，全体的に翻訳精度が非常に高い場合（つまり他の翻訳ツールで補完する必要がない）と，文章のつながりが著しく乱れているような翻訳文が出力されるような場合がある．

　一方，みらい翻訳の方は，最近（ここ一週間以内）になって試験的に利用しただけであり，翻訳精度について全体的な評価を下すには不十分な点がある．そのため，現時点での所感を短く記載する．みらい翻訳は，他言語から日本語への翻訳精度という点では，DeepLよりも精度は高いように感じられた．ただし，これも翻訳する文章によって異なるため，一概に全体として「みらい翻訳」の方が精度が高いと判断することができない（文章によっては，DeepLよりも表現が冗長だった場合などがある）．
　そして，DeepLのように，こちらでも翻訳を無視する（できない）場合があった．

・以下は，みらい翻訳での誤った翻訳の例（英語→日本語）
Portuguese defense minister: Macron is wrong on NATO (despite Trump)
→ポルトガルの国防相、(トランプにもかかわらず)と発言

　このように，DeepLと同様に，コロンが用いられている文章になると，精度の低い翻訳文章を出力することがある．ただ，DeepLと比較すれば，コロンなどに起因する翻訳ミスは少ないように感じられた．むしろ，「みらい翻訳」の場合，特定の問題箇所に起因しない翻訳ミスもいくつか見られた（ある文章内の一文を無視するような場合）．この問題については，まだ確認できたケースが多くないため，まだ問題箇所として断定することはできないだろう．とはいえ，この問題はDeepLでは筆者の使用においては確認できていないものだったため，気に留めておくべき点であると感じた．

　ただ，上述の二つの翻訳ツールは，いずれも既存の翻訳ツールと比較すれば，非常に翻訳精度が高いのは事実だろう（少なくとも，筆者が使ったことのあるオンライン上で誰でも利用できる翻訳ツールと比較すれば）．これまでのように，Google翻訳を使って，わざわざ自分で文章の整合性をとる時間を省くことができた．
　精度の向上によって，外国語に疎い筆者でも，世界中の様々な出来事を国内メディアよりも早く知ることができるようになった．要は，自動翻訳ツールであっても，それを駆使すれば，さらなる広い世界を見ることができる，ということである．今後のさらなる精度向上に期待したい．
―――――

▼本マガジンについて（以下の記事冒頭）

今日よりも素晴らしい明日のために――．まず世界を知り，そして考えること．貴方が生きるこの世界について，一緒に考えてみませんか？