見出し画像

Meta、低ビットレート音声コーデック「MLow」を発表 – 低速回線でも高品質な音声通話を実現

Metaは、WhatsApp、Instagram、Messengerなどのアプリを通じてリアルタイムコミュニケーション(RTC)を提供しています。これらのアプリは数十億人に利用されており、品質の高い通話体験を提供するために、新しい技術や手法の導入が不可欠です。今回、Metaは新しい音声コーデック「Meta Low Bitrate(MLow)」を開発しました。これは、特に低速回線での音声通話の品質を向上させるためのものです。

RTCアプリケーションには、オーディオ/ビデオコーデックが重要な役割を果たします。これらのコーデックは、キャプチャされた音声や映像データを効率的に圧縮し、インターネット経由で相手に送信します。例えば、典型的な通話の生の音声データは768 kbps(モノラル、48kHz、16ビット)に達しますが、現代のコーデックではこれを25-30 kbpsまで圧縮できます。これは、情報損失を伴うものの、音声信号の特性と心理音響学を駆使して、品質、ビットレート、計算の複雑さのバランスをとることによって実現されています。

Metaでは、長年にわたりOpusというオープンソースコーデックをRTCの標準コーデックとして使用してきました。Opusは、2012年にリリースされて以来、多くのインターネットアプリケーションで利用されている信頼性の高いコーデックです。しかし、Opusの最低動作ビットレートは6 kbpsであり、この時には音声の全ての周波数を十分にカバーできず、通話の音質が劣化することが確認されていました。

MLowは、低速回線でも高品質な音声通話を可能にする新しいコーデックです。Metaは、過去2年間の開発とテストを経て、MLowが6 kbpsでOpusの2倍の音質(POLQA MOS 1.89 vs 3.9 @ 6kbps WB)を達成することを確認しました。さらに、MLowはOpusに比べて計算の複雑さが10%低く、低スペックなデバイスでも優れた音質を提供できます。

MLowは、音声信号を低周波帯と高周波帯に分割し、それぞれ別々にエンコードすることで圧縮効率を向上させています。この方法により、わずかなビット数で高周波帯をエンコードでき、低ビットレートでSuperWideBand(32kHz)の音質を提供します。

MLowは、すでにInstagramとMessengerの通話に完全に導入されており、WhatsAppでも展開が進められています。この新しいコーデックの導入により、ユーザーのエンゲージメントが大幅に向上し、音声通話の品質が改善されています。

また、MLowは低ビットレートでも効果的な誤り訂正(FEC)戦略を可能にし、パケットロスが多い状況でも音質を維持できます。例えば、14 kbpsのビットレートで30%の受信側パケットロスが発生しても、MLowはOpusよりも高品質な音声を提供できます。

MLowは、特に低スペックのデバイスや低速回線でも高品質な音声通話を実現するための重要な技術となります。

詳細内容は、Metaが提供する元記事を参照してください。

【引用元】

【読み上げ】
VOICEVOX 四国めたん/No.7


この記事が気に入ったらサポートをしてみませんか?