見出し画像

稲羽兎迅速報 英語力向上【ローカリゼーション作業における機械翻訳 】 謹賀寅年 英字新聞




【読者諸君!!!俺氏がとっておきの記事を見つけましたぞ!!!この新聞記事を書いた美人の英語力は★★★★★です。これまでに見たことがない高い文章力で、下手したら文学賞が取れる英文です。】







ローカリゼーション作業における機械翻訳

Alconost社のKrisTrusava氏が、ローカリゼーション作業における機械翻訳のメリットと課題を調査しています





執筆者 Kris Trusava
Friday 28th January 2022
 機械学習はほぼすべての業界に浸透しており、ゲームのローカリゼーションも例外ではありません。 ソフトウェアプロバイダーは、機械翻訳製品がローカリゼーションの新時代を迎えると主張していますが、ゲーマーは、ゲームパブリッシャーが細部にもっと注意を払うことを望んでいることがよくあります。

 現在、機械翻訳のポストエディットに取り組んでいるプロのローカリゼーション会社として、Alconost社はこのトピックを見逃すことができませんでした。 この記事では、機械翻訳(MT)のホットな点(およびそうでない点)と、品質を犠牲にすることなくそれを最大限に活用する方法を見つけることを目的としています。

一言で言えばNMT:それは一体何ですか?

 
 機械学習がローカリゼーションに導入されたとき、それは大きな資産と見なされ、ローカリゼーション企業はかなり長い間PEMTアプローチを使用して作業していました。 PEMTは、後編集された機械翻訳の略です。つまり、機械がテキストを翻訳した後、翻訳者がテキストを調べて編集することを意味します。 PEMTの主な問題は、テキストを以前または現在の翻訳や用語集と比較せずに翻訳することです。つまり、「見る」ときに翻訳するだけです。したがって、当然、この方法では多くの間違いが発生し、手動で編集する必要があります。

 時が経ち、技術が進歩するにつれて、NMT(ニューラル機械翻訳)が登場しました。これにより、はるかに信頼性が高く堅牢なソリューションが証明されました。 NMTは、ニューラルネットワークとディープラーニングを使用して、テキストを翻訳するだけでなく、用語とその詳細を実際に学習します。これにより、NMTはPEMTよりもはるかに正確になり、十分な学習があれば、手動翻訳よりもはるかに高速に高品質の結果が得られます。


NMTソリューション:簡単な概要


 市場に数十の既製のNMTソリューションがあるのは当然のことです。これらは、ストックエンジンとカスタムNMTエンジンの2つの主要なカテゴリに分類できます。カスタム(またはニッチ特化の)NMTツールについては少し後で説明します。今のところ、ストックNMTに焦点を当てましょう。

 ストックNMTエンジンは、一般的な翻訳データに基づいています。これらのデータセットは広大で豊富ですが(たとえば、Googleのデータベース)、ドメイン指向ではありません。つまり、標準のNMTツールを使用すると、テキストの意味は一般的に理解できますが、特定のフレーズや単語の正確な翻訳は得られません。

 標準のNMTエンジンの例には、Google Cloud Translation、Amazon Translate、DeepL Translator、CrossLang、Microsoft Translator、Intento、KantanMTが含まれます。

 これらのソリューションの主なメリットは、それらのほとんどが公開されており、無料で使用できることです(Google翻訳など)。商用ストックNMTは、APIと統合オプションを備えた有料サブスクリプションを提供します。しかし、これらの最大のデメリットは、ゲームのローカリゼーションの複雑さを考慮していないことです。詳細については、以下をご覧ください。



ゲームのローカリゼーションの多くの複雑さ

 機械翻訳は多くの業界で問題なく機能しますが、ゲームのローカリゼーションは難しい問題であることが判明しました。この主な理由は、ゲーム(ゲームの種類に関係なく)は常に没入型の体験を目指しており、その体験の中心的な部分の1つは、ごく自然な対話とゲーム内のテキストです。では、それらを適切に翻訳することについて、何がそれほど難しいのでしょうか。

創造性

 当たり前のように聞こえるかもしれませんが、特に翻訳に関しては、創造性がゲームに命を吹き込む上で大きな役割を果たします。翻訳者は突然のひらめきを持って、元のテキストよりもはるかによくプレイヤーに共鳴する予期しない言い回しを思い付くかもしれません。

 機械は創造的であることができますか?まだ。つまり、機械翻訳には、ゲーム全体を輝かせるクリエイティブな要素が常に欠けている可能性があります。


特定の言い回し、方言、スラング

 ローカリゼーションにおける最大の課題の1つは、翻訳した文をできるだけ自然にすることです。また、国や地域ごとに固有の言語や方言があるため、翻訳をうまく適応させるには、文化を完全に理解する必要があります。

 機械学習ソリューションは既存のデータベースでトレーニングできますが、地元の人だけが使い方を知っている具体的なフレーズに出くわした場合はどうでしょうか。これは、ネイティブスピーカーの言語学者による専門的な翻訳とコミュニティのフィードバックが非常に役立つ場所です。その複雑さを知っているターゲット言語のネイティブスピーカーからのフィードバックは、最高の言葉遣いについてアドバイスすることができます。そのためには、理論的な知識だけでなく、使用している言語を理解する必要があります。


トーンと全体的な雰囲気

 特定の言葉は特定のトーンを伝えます、そしてこれは私たちが考えずに、ただ感じることによって行うことです。 したがって、ゲームを翻訳するとき、人間の翻訳者はゲームの全体的な雰囲気(または特定の対話)を感知し、元の言葉遣いだけでなく、トーンとムードをよりよく伝える同義語を使用できます。 逆に、機械は「空気を読む」ことができないため、翻訳が自然な英語になっていない場合もあります。



ゲームのローカリゼーションにMTを使用するメリット

 ゲームのローカリゼーションに関するすべての課題にもかかわらず、機械翻訳は依然としてかなりまともな仕事をしています。このテクノロジーには、特定のタスクに関してMTを優れた選択肢にするいくつかの重要なメリットがあります。

スピード

 速度は、おそらく機械翻訳の最大の利点であり、その独自のセールスポイントです。機械は、翻訳者が数日または数週間かかるのに比べて、ほんの数分で大量のテキストを翻訳できます。多くの場合、最初に機械翻訳を作成してから編集する方が、より速く効率的であることがわかります。さらに、MTの速度は、新しいコンテンツを迅速にリリースする必要がある場合や、「十分な」翻訳品質で管理できる場合に非常に便利です。


ゲーム外コンテンツの翻訳

ゲームのローカリゼーションについて話すとき、最初に頭に浮かぶのは通常、ゲーム内の対話です。しかし、ゲームのローカリゼーションはそれだけではありません。ユーザーマニュアル、ハウツー、記事、ガイド、マーケティングテキストが含まれています。この種のコピーは、創造性や画像をあまり使用していません。これらの素材は、ゲーム体験がどれほど没入できるかに実際には影響を与えないからです。ユーザーがブログを読んでいるときに間違いを見つけた場合、ゲーム体験を台無しにする可能性は低くなります。


サービスのコスト

 機械翻訳のもう1つの大きなメリットは、比較的低コストであることです。プロの翻訳者の割合と比較して、機械翻訳はより手頃な価格になる傾向があります。したがって、専門家をより重要なタスクに割り当てることができる一方で、コストを節約できます。


翻訳の一貫性

 MTがプロジェクトに利益をもたらすもう1つの方法は、翻訳の一貫性です。複数の独立した翻訳者がテキストを処理する場合、特定の単語を異なる方法で翻訳する可能性があるため、最終的には異なる翻訳になります。しかし、機械翻訳では、繰り返しのフレーズは常に同じ方法で翻訳されるため、テキストの一貫性が向上します。


機械翻訳はゲームに十分ですか?

 ゲーマーによると、MTは100%正確な翻訳ではありません。 たとえば、最近のRedditのディスカッションでは、欲求不満のゲーマーが残した何百ものコメントが取り上げられています。その大多数は同じことを言っています。企業は高品質の翻訳に投資する暇はなく、短い期間で利益を上げることが求められています。 そして、「十分に良い」かつ迅速な完成品を提供するためのツールは何ですか? ビンゴ!正解は機械翻訳です。

 残念ながら、ゲーム会社がゲームをより早くリリースしようとすると、ユーザーの体験が低下するだけでなく、ブランドロイヤルティが大幅に低下します。数 多くのゲーマーは、ゲーム会社に対し不満な点の1つとして、不十分な翻訳を挙げています。

 では、Google NMTでは不十分な場合、どのようなオプションがありますか? これが最も効果的な方法のアイデアです。


執筆者のKris Trusava氏

Kris Trusava氏は、ゲームやその他のソフトウェアの80を超える言語へのローカリゼーションサービスを提供するAlconost社のローカリゼーション事業開発マネージャーです。




ローカリゼーション特化のNMT

 ニューラル機械翻訳には特定のデメリットがありますが、多くのメリットもあります。迅速で、適度に正確であり、大量のドキュメント(ユーザーマニュアルなど)をすばやく翻訳する必要がある場合は、実際に非常に役立ちます。したがって、完璧なソリューションと見なされるのは、ニッチ指向のローカリゼーション特化のNMT(またはカスタムNMT)です。

 たとえば、Alconost社は現在、ニューラル機械学習とさまざまな言語の翻訳の膨大なデータベースを使用する製品に取り組んでいます。これにより、より高い精度を実現し、一般的な翻訳だけでなくゲームの翻訳にもマシンを適応させることができます。この2つには大きな違いがあります。さらに、オープンソースデータでクラウドプラットフォーム(CrowdinやGitLoсalizeなど)を使用しています。つまり、あるプロジェクトの用語集と翻訳メモリを別のプロジェクトに使用できるということです。そして明らかに、私たちの翻訳者は、翻訳が正しく行われたことを確認するためにテキストを後編集します。

 カスタムドメインに適合したNMTソリューションは、特定のドメインを念頭に置いて設計されているため、ローカリゼーションのマイルストーンになる可能性があります。これらの最大のメリットは、高い翻訳精度、スピード、手頃な価格(プロの翻訳者を雇うよりも安いため)、そして新しいニッチやドメインを探索するオプションです。

 ユーザーレビューなどの一部のコンテンツは、具体的すぎてあまり多くないため、翻訳されない場合があります。 大量のポストエディットが必要になるため、翻訳にストックNMTソリューションを使用することはあまり意味がありません。

 ただし、カスタムNMTツールは、ユーザーレビューを処理し、声のトーンを「理解」するように設計できるため、この特殊なコンテンツでもマシンで翻訳できます。 このソリューションはAirbnbによって実装されており、レビューやその他のユーザー生成コンテンツは、[翻訳]ボタンを押すだけですぐに翻訳されます。

 さらに、機械翻訳者は、感情や気分を認識し、機械学習分類器と組み合わせると、フィードバックにラベルを付けて優先順位を付けるようにトレーニングできます。 これは、ユーザーのオンライン行動に関するデータを収集するためにも使用できます。これは、どの企業にとっても非常に価値のある資産です。


機械翻訳と従来のローカリゼーションとの違い

 最後に、機械によって翻訳されたテキストをローカライズすることの複雑さと、プロセスが標準のローカリゼーションとどのように異なるかについて話しましょう。さまざまなプロジェクトに取り組んでいる間に得た私たち自身の経験に基づいて、2つのアプローチを比較します。


プロセス

 プロジェクトを最初からローカライズする場合、チームには最初から用語集とコンテキストが用意されているため、品質を完全に管理していると言っても過言ではありません。ここでは、テキストは特定のドメインを念頭に置いて翻訳されており、翻訳されたコピーを後編集する必要があることはめったにありません。

 ただし、機械翻訳では状況が少し異なります。ソーステキストはさまざまなエンジンで翻訳できますが、そのすべてが品質と精度の点で異なります。したがって、これらのテキストの使用を開始するときは、翻訳がドメインとブランドのスタイルに適合することを確認するために、クライアントに利用可能なすべての資料(スタイルガイド、用語集など)を要求します。これは、機械翻訳の後編集には、特定のプロジェクトの品質と精度を評価する追加の手順が必要であることを意味します。


品質

 従来のローカリゼーションアプローチを選択した場合、99%の確率で、特定の言語とドメインで最も経験のある人にプロジェクトが割り当てられます。

 しかし、機械翻訳では、機械がどれだけうまく訓練されているか、さまざまな言語でどれだけのデータがあるかを実際に確認することはできません。 1つのエンジンが10,000ページのスペイン語-英語の翻訳を学習し、別のエンジンが1,000,000ページを学習した可能性があります。 明らかに、後者の方がより正確になります。

 要するに、ニッチなトピックについてプロのローカリゼーション会社によって「訓練された」機械翻訳エンジンを使用する場合、カスタマイズされたMTエンジンの「習熟度」が保証され、その結果、翻訳の品質が保証される可能性が高くなります。十分な翻訳データベースとプロの編集者がやってくれているので、あなたがプロジェクトの進捗が順調に進んでいることを知って、安心できるわけです。



○今週の新しい単語 覚えとけ

新しい単語ございません。できればこの記事をすべて覚えてください。冗談抜きで英語力アップアップです。









An introduction to machine translation for localisation

Alconost's Kris Trusava looks into the advantages and challenges of machine translation to localise games




Machine learning has made its way into nearly every industry, and game localization is no exception. Software providers claim that their machine translation products mark a new era in localization, but gamers are often left wishing that game publishers would pay more attention to detail.

As a professional localization company that currently is working with machine translation post-editing, Alconost could not pass up the topic. In this article we aim to find out what's hot (and what's not) about machine translation (MT) and how to get the most out of it without sacrificing quality.

NMT in a nutshell: what on Earth is it?

When machine learning was introduced to localization, it was seen as a great asset, and for quite a while localization companies worked using the PEMT approach. PEMT stands for post-edited machine translation: it means that after a machine translates your text, translators go through it and edit it. The main problem with PEMT is that the machine translates without comparing the text to previous or current translations and a glossary -- it just translates as it "sees" it. So naturally this method results in numerous mistakes, creating a need for manual editing.

As time passed and technology advanced, NMT (neural machine translation) came into play. This proved a much more reliable and robust solution. NMT uses neural networks and deep learning to not just translate the text but actually learn the terminology and its specifics. This makes NMT much more accurate than PEMT and, with sufficient learning, delivers high-quality results much faster than any manual translation.

NMT solutions: a brief overview

It's no surprise that there are dozens of ready-made NMT solutions on the market. These can be divided into two main categories: stock and custom NMT engines. We will talk about custom (or niche-specific) NMT tools a bit later; for now, let's focus on stock NMT.

Stock NMT engines are based on general translation data. While these datasets are vast and rich (for example, Google's database), they are not domain-oriented. This means that when using a stock NMT tool you get a general understanding of the text's meaning, but you don't get an accurate translation of specific phrases and words.

Examples of stock NMT engines include Google Cloud Translation, Amazon Translate, DeepL Translator, CrossLang, Microsoft Translator, Intento, KantanMT.

The chief advantage of these solutions is that most of them are public and free to use (like Google Translate). Commercial stock NMTs offer paid subscriptions with their APIs and integration options. But their biggest drawback is that they don't consider the complexity of game localization. More on that below.

The many intricacies of game localization

While machine translation works fine in many industries, game localization turned out to be a tough nut to crack. The main reason for this is that gaming (regardless of the type of game) always aims for an immersive experience, and one core part of that experience is natural-sounding dialogue and in-game text. So what's so challenging about translating them properly?

  • Creativity

It may sound like a given, but creativity plays a massive role in bringing games to life, especially when it comes to their translation. A translator might have a sudden flash of inspiration and come up with an unexpected phrasing or wording that resonates with players much better than the original text.

Can a machine be creative? Not yet. And that means that machine translations will potentially always lack the creative element that sometimes makes the whole game shine.

  • Specific phrasing, dialects, and slang

One of the biggest challenges in localization is making the translation sound as natural as possible. And since every country and region has its own specific languages and dialects, it takes a thorough understanding of one's culture to successfully adapt a translation to it.

While a machine learning solution can be trained on an existing database, what if it comes across a highly specific phrase that only locals know how to use? This is where professional translation by native speaking linguists and community feedback are highly helpful. Input from native speakers of the target language who know its intricacies can advise on the best wording. And for that, you need to have a feel for the language that you're working with, not just theoretical knowledge.

  • Tone and overall vibe

Certain words convey a certain tone, and this is something that we do without thinking, just by feel. So when translating a game, a human translator can sense the overall vibe of the game (or of a specific dialogue) and use not just the original wording but synonyms that better convey the tone and mood. Conversely, a machine is not able to "sense the mood," so in some cases the translation may not sound as natural as it could.

Advantages of using MT for game localization

Despite all the challenges around game localization, machine translation still does a pretty decent job. This technology has several significant benefits that make MT a great choice when it comes to certain tasks.

  • Speed

Speed is probably the biggest benefit of machine translation and its unique selling point. A machine can translate massive chunks of text in mere minutes, compared to the days or even weeks it would take a translator. In many cases it proves faster and more efficient to create a machine translation first and then edit it. Besides, the speed of MT is very handy if you need to quickly release an update and can manage with "good enough" translation quality.

  • Translation of out-of-game content

When talking about game localization, the first thing that comes to mind is usually in-game dialogue. But game localization is much more than that: it includes user manuals, how-tos, articles, guides, and marketing texts. This kind of copy doesn't employ much creativity and imagery, since these materials don't really impact how immersive the gaming experience will be. If a user spots a mistake while reading your blog, it's less likely to ruin the game experience for them.

  • Cost of services

One more huge advantage of machine translation is its relatively low cost. Compared to the rates of professional translators, machine translation tends to be more affordable. Hence, it can save you money while letting you allocate experts to more critical tasks.

  • Consistency of translation

One more way MT can benefit your project is translation consistency. When several independent translators work on a text, they may translate certain words differently, so that you end up with different translations. But with machine translation repetitive phrases are always translated the same way, improving the consistency of your text.

Is machine translation good enough for games?

MT is not 100% accurate, according to gamers. For example, a recent Reddit discussion features hundreds of comments left by frustrated gamers, the majority of whom say the same thing: companies are going for fast profits instead of investing in high-quality translation. And what's the tool to deliver quick results that are "good enough"? You guessed it -- machine translation.

Unfortunately, when gaming companies try to release games faster it leads not only to a poor user experience but also to a significant drop in brand loyalty. Many gamers cite poor translations as one of the biggest drawbacks of gaming companies.

So what options are there when Google NMT isn't enough? Here's an idea for what might work best.

  • Localization-specific NMT

While neural machine translation has certain flaws, it has many benefits as well. It's quick, it's moderately accurate, and it can actually be quite helpful if you need to quickly translate massive amounts of documents (such as user manuals). So what we see as the perfect solution is niche-oriented, localization-specific NMT (or custom NMT).

For instance, Alconost is currently working on a product that uses neural machine learning and a vast database of translations in different languages. This lets us achieve higher accuracy and adapt the machine not just for general translation, but for game translation -- and there is a big difference between the two. In addition, we use cloud platforms (such as Crowdin and GitLoсalize) with open-source data. That means that glossaries and translation memories from one project can be used for another. And obviously our translators post-edit the text to ensure that the translation was done right.

Custom domain-adapted NMT solutions may become a milestone in localization, as they are designed with a specific domain in mind. Their biggest advantages are high translation accuracy, speed, affordability (as they're cheaper than hiring professional translators), and the option to explore new niches and domains.

Some content, such as user reviews, sometimes goes untranslated because it is too specific and there is not much of it. It wouldn't make much sense to use a stock NMT solution for their translation, as it would require heavy post-editing.

Custom NMT tools, however, can be designed to work with user reviews and "understand" the tone of voice, so that even this specialized content can be translated by a machine. This solution has been implemented by Airbnb, where reviews and other user-generated content are translated in a flash just by pressing the "Translate" button.

In addition, machine translators can be trained to recognize emotions and mood and, when paired with machine-learning classifiers, to label and prioritize feedback. This can also be used to collect data on users' online behavior, which is a highly valuable asset to any company.

How machine translation differs from traditional localization

Finally, let's talk about the intricacies of localizing a text translated by a machine, and how the process differs from standard localization. We'll compare the two approaches based on our own experience acquired while working on different projects.

  • Process

When we localize a project from scratch, it's safe to say we are in full control of the quality, since the team has glossaries and context available from the start. Here the text is translated with a specific domain in mind, and only rarely do we have to post-edit the translated copy.

With machine translation, however, things are a bit different. The source text can be translated by different engines, all of which differ in terms of quality and accuracy. So when we start working with these texts, we request all available materials (style guides, glossary, etc.) from the client to ensure that the translation fits the domain and the brand's style. This means that post-editing machine translations requires the additional step of assessing the quality and accuracy for the given project.

  • Quality

When you choose a traditional localization approach, there is a 99% chance that your project will be assigned to a person who has the most experience with your particular language and domain.

But with machine translation you can't really be sure how well the machine has been trained and how much data it has for different languages. One engine may have learned 10,000 pages of Spanish-English translations, while another engine has studied 1,000,000 pages. Obviously, the latter is going to be more accurate.

The bottom line is that when working with a machine translation engine "trained" by a professional localization company on niche topics, there's an excellent chance that they'll ensure the "proficiency" of the customized MT engine and, consequently, the quality of the translation. With an ample translation database and professional editors by side, you can put your mind at ease, knowing that your project is in good hands.



【出所:https://www.gamesindustry.biz/articles/2022-01-26-an-introduction-to-machine-translation-for-localisation

欧州最大のゲームメディアであるEurogamer.netを運営するGamer Netoworkによるゲーム業界向け情報サイトの英字新聞です。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?