Azure AI により、企業が 100 種以上の言語でユーザーにサービスを提供可能に (2021/10/14、ニュースリリース)

※米国マイクロソフトからブログ更新のお知らせがニュースリリースで来ました!

+++++
Azure AI により、企業が 100 種以上の言語でユーザーにサービスを提供可能に
+++++

※本ブログは、米国時間10月11日に公開された“Azure AI empowers organizations to serve users in more than 100 languages”の抄訳を基に掲載しています。
< https://blogs.microsoft.com/ai/microsoft-translator-100-language-milestone/ >

ジョン ローチ (John Roach)

本日、マイクロソフトは Translator < https://azure.microsoft.com/ja-jp/services/cognitive-services/translator/#overview >に新たに 12 の言語と方言を追加したことを発表しました。
これにより、100 種以上の言語と方言間での翻訳が可能となり、
世界の 56 億 6 千万人の人々がテキストや文書による情報にアクセスできるようになりました。

「話す言語に関係なくすべての人がコミュニケーションできるようにする< https://aka.ms/translator100languagesTranslatorBlog >というマイクロソフトの強い願いを達成する上で 100 言語は良いマイルストーンです」とマイクロソフトのテクニカルフェロー兼 Azure AI チーフテクノロジオフィサーのゼドン ファン (Xuedong Huang < https://www.microsoft.com/en-us/research/people/xdh/ >) は述べています。

現在、Translatorは、英語、中国語、ヒンディー語、アラビア語、スペイン語など、世界で最も話されている言語をカバーしています。最近になり、AI テクノロジの進歩により、カナダの約 4 万人のイヌイットが使っているイヌクティトゥット語(イヌクトゥット語の方言)< https://www.microsoft.com/ja-jp/translator/blog/2021/01/27/inuktitut-is-now-available-in-microsoft-translator/ >など、情報量の少ない言語や絶滅が危惧される言語のライブラリーも増やしています。

新たに 100 言語を超える結果をもたらした追加言語は、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語(キリル文字)、モンゴル語(繁体字)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語(ラテン)であり、これらの言語は合計 8,460 万の人々に母国語として使用されています。

■言葉の壁をなくす

何千もの組織が、世界中のメンバー、従業員、顧客とのコミュニケーションにTranslator を利用しています。たとえば、
Volkswagen Group < https://customers.microsoft.com/ja-jp/story/779468-volkswagen-azure-automotive-en >は機械翻訳の技術を使って、60 以上の言語で顧客にサービスを提供しており、年間で 10 億語以上を翻訳しています。
同社では、まず Translator の標準的なモデルを作成し、Translatorのカスタム機能< https://docs.microsoft.com/ja-jp/azure/cognitive-services/translator/customization >を使って、業界特有の用語にモデルを微調整しています。

ファンによれば、2015 年にAzure Cognitive Services
< https://azure.microsoft.com/ja-jp/services/cognitive-services/ >を提供開始した時に、すでにマイクロソフトのビジョンの中核には、企業が事前に学習させた AI モデルが自社の特定ニーズに合わせて微調整できる機能がありました。

Azure Cognitive Services には、言語に加えて、音声、画像、意思決定タスク用の AI モデルが含まれています。これらのモデルにより、企業は OCR (光学式文字認識) などのComputer Vision
< https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/ >のテクノロジを活用できます。
このサービスは、Translator がカバーする 100 種以上の言語のフォームに入力されたテキストを抽出し、そのテキストを使ってデータベースに入力するものです。

「100 言語のサポートに到達した翻訳に加えて、音声処理や OCR についても、言語の壁を取り除きたいと考えています」

とファンは述べています。

■多言語モデル

ファンによると、マイクロソフトにおける機械翻訳技術の最前線にあるのはZ-code と呼ばれる多言語 AI モデルです。このモデルは、インドのヒンディー語、マラーティー語、グジャラート語といった言語ファミリーから複数の言語を組み合わせたものです。
こうすることで、個々の言語モデルが相互に学習でき、高品質な翻訳を実現するために必要なデータ量を減らすことができます。たとえば、ルーマニア語の翻訳において、関連するフランス語、ポルトガル語、スペイン語、イタリア語の翻訳モデルをグループ化することで品質を向上できました。

「共通点を活用し、その共有された伝達学習能力を使って、言語ファミリー全体を改善することができます」

とファンは述べています。

また、必要なデータ量が少なくなったことで、Translator チームは、情報量が限られた言語や、ネイティブスピーカーの人口が減少して絶滅の危機に瀕している言語のモデルを構築することができるようになりました。
Translator のサポート言語数 100 を達成させた言語の中には、
リソースの少ない言語や絶滅の危機に瀕している言語もあります。

Z-code は、テキスト、画像、音声、言語の AI モデルを組み合わせることで、話す、見る、聞く、理解することができる AI システムを実現し、人間の能力をより効率的に強化するという広範な取り組みの一環であると、ファンは付け加えました。
この XYZ-code ビジョン< https://www.microsoft.com/en-us/research/blog/a-holistic-representation-toward-integrative-ai/ >とでも言うべきビジョンが実現されつつある証拠として、多言語モデルの訓練テクノロジで作られた新しい言語が続々と登場しています。

「これにより人々の間の距離を縮めることができます。XYZ-code のビジョンによってすでにこの能力が実用化されています」

とファンは述べています。

●本ブログの詳細につきましては、日本マイクロソフト広報資料サイトをご覧ください。
< https://news.microsoft.com/ja-jp/2021/10/14/211014-microsoft-translator-100-language-milestone/ >

この記事が気に入ったらサポートをしてみませんか?