障害のある人の発話に対応した音声認識技術開発プロジェクト「Speech Accessibility Project」とは何か

Screenless Media Lab.ウィークリー・リポート
2022.10/21 TBSラジオ『Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、障害のある人に対応した音声認識技術の開発プロジェクトについて紹介します。

◾アメリカで発足「「Speech Accessibility Project」

音声認識技術の様々な発展については、これまで当ラボも多く紹介してきました。また、障害のある人に向けた支援技術として、色やお札の種類を判別してユーザーに伝える技術、特にマイクロソフトが開発する「Seeing AI」など、様々な取り組みを紹介しています。

そんな中、新たなプロジェクト「Speech Accessibility Project」が2022年10月、米イリノイ大学アーバナ・シャンペーン校が主導する形で発足しました。このプロジェクトにはAmazon、Apple、Google、Meta、Microsoftといった大手IT企業のほか、非営利の障害者団体が参加しています。

このプロジェクトの目的は、障害者に特化した音声認識技術の開発にあります。音声認識技術はスマホやスマートスピーカーに搭載されていますが、障害に関連する発話には対応していないものがほとんどです。例えば、筋萎縮性側索硬化症(ALS)やパーキンソン病、脳性まひやダウン症等の影響を受けた人の発話はシステムが対応していませんが、その原因はデータセット(学習の元になる音声)にあります。

そこでプロジェクトでは、録音された音声サンプル提供する有償ボランティアを募集し、それらの音声サンプルデータを機械学習し、様々な発話に対応したシステムの作成を目指します。プロジェクトはまず、アメリカ英語に焦点を当てるとしています。

◾技術を利用することでできること

研究は、電気・コンピュータ工学が専門のマーク・ハセガワ・ジョンソン教授をリーダーに、言語聴覚学の専門家等が参加しています。デジタル社会における音声コミュニケーションは重要性を増していますが、特に様々な障害のある人にとっては、スマホを用いて声だけで周りの情報を得たり、物事を指示することが簡単になることは、生活環境の大幅な向上につながります。

様々な障害に対応するデジタル機器は、年々増えています。グーグルやアップルも全盲や弱視の人が人や対象を識別するアプリを提供したり、2020年からiphoneの一部の機器では、「人の検出」という、周りに人がいることを知らせる機能も搭載されています。他にも、音声情報を自動で文字起こしする「キャプション機能」のように、聴覚障害のある人だけでなく、様々な人々に利用される機能もあります。

このように、技術開発を進めることで、私たちの社会をよりよいものにしていくことは、誰にとっても望ましいことであると思われます。

この記事が気に入ったらサポートをしてみませんか?