会議の音声を即座に字幕化ーー「リアルタイムキャプション機能」を考える

放送の様子はこちら(下記サイトでは音声配信も行っています)。
「会議の音声を即座に字幕化~「リアルタイムキャプション機能」を考える」(Screenless Media Lab.ウィークリー・リポート)
2020.6/26 TBSラジオ『Session-22』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、音を聴くのが困難な聴覚障害者に対して、コロナが及ぼす影響について考えていきたいと思います。

◾マスクで遮断される表情

新型コロナウイルスの影響は、聴覚障害者にとって大きな影響を及ぼしています。「MIT Technology Review」の記事「新型コロナが変えた聴覚障害者の日常、「新しい生活様式」バリアに」では、新型コロナウイルスと聴覚障害者をとりまく様々な問題が語られています。

まず、最早日常生活に欠かすことのできなくなったマスクですが、口の動きから意味を推測する聴覚障害者にとって、マスクは生活に著しい支障をきたします。コミュニケーションにおいて、喜怒哀楽を示す「表情」は、聴覚障害者にとって重要な意味を持ちますが、それ故に、マスクによって口元がみえないという問題は、相手の感情を察することが難しくなってしまいます。これは聴覚障害者に限ったことではありませんが、感情の交換を行う中で、マスクが遮断してしまう点について、配慮する必要があります。

アメリカでは口元を透明なプラスチックに変えた医療用マスクが製造されており、注目が集まっています(日本でも様々な透明なマスク=クリアマスクが販売されています)。

このように、ソーシャルディスタンスが求められる公共空間において、ただでさえ音によるコミュニケーションが困難な聴覚障害者にとっては、多くの負担を強いるものになっています。

◾リアルタイムキャプション(字幕)技術

聴覚障害者にとって、キャプション(字幕)は非常に重要です。近年はYouTube等の動画サイトでも、音声にその場でキャプションをつけたり、さらには他の言語に即時翻訳できる技術もあります。そんな中でも、このコロナ禍で一躍脚光を浴びたオンラインミーティングにも、キャプション機能が一部搭載されるようになりました。

googleが提供するビデオチャットツールの「Google Meet」やマイクロソフトのTemsには、現在のところ英語のみの対応ですが、リアルタイムでキャプションを表示する機能が追加されています。また、英語のキャプションを日本語に翻訳するツール等を用いれば、場合によっては現在でもリアルタイムでの日本語翻訳も可能になるでしょう。

こうしたキャプションサービスは、即座に声を文字に起こす技術であり、様々に応用可能です。例えば大学のオンライン講義でも、音声に字幕をつけることで学習効果の向上が期待できたり、手軽に文字情報だけを復習用に読むこともできます。他にも、会議の記録などにも文字起こし機能を用いることができます。リアルタイムでの文字起こしの他、録画された動画から字幕を作成できるツールもあるので、報告書の作成等が手軽になります。


リアルタイムキャプション機能は、コロナ禍以前からある「Ava」というアプリを通して、聴覚障害者に利用されていました。こうした技術は、聴覚障害者用につくられたものがより一般的に利用できるものであったり、逆に一般的な利用を目的としたものが、転じて聴覚障害者にも活用されるといったケースもあります。いずれにせよ、障害の有無に関わらず、私達が目指すより良い社会のために、必要な技術が求められているのです。


この記事が気に入ったらサポートをしてみませんか?