METAの目指すメタバース上でのコミュニケーションーー「文字のない言語のリアルタイム翻訳」の紹介

2022.11/11 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、METAが研究を行うリアルタイム翻訳AIについて紹介します。

◾METAによる口頭言語「福建語」の翻訳AI

昨今、AI技術の向上により、翻訳ソフトはその精度を著しく発達させています。また英語から日本語などへのリアルタイム音声翻訳サービスなどもあり、各社が様々なサービスを展開しています。

そんな中、米META(旧Facebook)は2022年10月19日、文字のない口頭言語である「福建語(Hokkien)」をリアルタイムで翻訳する音声翻訳AIを開発したと発表しました(MetaのAIプロジェクト「Universal Speech Translator(UST)」の一環とのことです)。喋った言葉をリアルタイムで翻訳し、合成音声で相手とコミュニケーションするというものですが、どういうことなのでしょうか?

翻訳といえばこれまで、基本的にテキストの翻訳を意味していました。したがって、翻訳作業に必要なのは大量のテキストデータであり、これをAIに学習させる必要があります。

また従来のリアルタイム翻訳の方法は、聞き取った音声をテキスト化(文字起こし)し、それを翻訳。ここまでで終わるものもあれば、そこからさらに音声に変換するものもあります。いずれにせよ、文字を持たない言語では、この作業ができません。

しかしMETAによれば、現存する7000以上の言語のうち、40%以上は主に文字を持たない口語だけの言語であるといいます。例えば中国の福建省を中心に使用されている「福建語」もそのひとつです。福建語は福建省だけでなく、シンガポールやフィリピン、台湾、マレーシアといったアジア地域でも利用されている言語ですが、標準的な表語文字がないため、翻訳AIを開発するのは様々な困難があったといいます。

METAによれば、中間言語として中国の北京語を利用。英語や福建語を一度北京語に変換することで学習データを増やし、AIのモデルの性能をアップ。また福建語の音声を意味に分解するなど、様々な手法を試したと述べています(以下のリンクはかなり専門的な内容を含んでいます)。

◾リアルタイム翻訳の目的

こうした複雑な過程を必要とするため、現状では一度に一つの文しか翻訳できません。ただし、今回の研究データはオープンソースで公開されており、福建語を含め、その他の様々な言語でこうした研究が進むことが期待されています。

もちろん、METAの目標は福建語以外の、様々な口頭言語の翻訳にあります。METAがこうした研究を行う背景には、METAが推進するメタバース空間での、リアルタイムコミュニケーションを可能にするためであり、言語の壁を取り除くことを目標にしているからです。将来的に、翻訳を利用した多様なコミュニケーションが可能な社会が到来するかもしれません。

一方、世界の言語の中には、口笛で遠方の人とコミュニケーションを行う「口笛言語」など、実に様々な形の言語体系が存在しています。消滅の危機にある言語もありますが、こうした言語は人類の歴史や言語発展の過程を解き明かすのに重要なデータでもあります。リアルタイム翻訳と同時に、こうした言語に関する情報を収集・保存することも必要でしょう。


この記事が気に入ったらサポートをしてみませんか?