糖尿病の疑いやコロナ、酩酊状態を声で診断するーー最新「声診断技術」の紹介

2023.12/01 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、声で自分の状況を診断できる「声診断技術」の最新論文等をご紹介します。

◾声診断技術は日々発展している

AIを利用した音声解析技術が日々発展しています。当ラボでもこれまで、音声を利用した様々な音声診断技術について紹介してきました。

そのひとつが、コロナウイルスを音声で診断する、といった技術です。すでに2020年の段階で、MIT等が数十万の咳のサンプルデータを構築し、そこにコロナ患者数千件の咳データを学習させ、診断技術の開発を進めていました。

その後、英ケンブリッジ大学をはじめとして、同様のプロジェクトもはじまり、オーストラリアの「ResApp」という企業では、スマホを用いて呼吸器疾患を音声で診断するアプリ開発が行われました。その後2022年10月には、米ファイザーが同社を1億7900万豪ドル(約167億円)買収すると発表しました。

このように音声診断技術はビジネスとしても注目される他、2022年2月には、実際にアルゼンチンのブエノスアイレス市が咳でコロナ陽性者を判別するサービス「IATos」の提供を開始しています。これはスペイン語でAIを意味するIAと、咳を意味するTosを掛け合わせた造語で、通話アプリ「Whats app」の中の、市が運営するチャットボット「Boti」で利用するというものです。音声診断によって、陽性であることが疑われる場合に、診断を勧めるというものです。

他にも、咳やいびきから個人を特定する技術や、肺の症状だったり、あるいはうつ症状を音や声でモニタリングする技術など、ヘルスケア領域でも研究が進んでいます。

◾自分がどれだけ酔っているかをスマホで診断する

声から酩酊状態を診断する技術もあります。一度紹介していますが、2022年12月には、オーストラリアの研究者たちが、飲酒した人とそうでない人を声のパターンで識別するAIを開発しました。研究によれば、初期酩酊度であれば70%の精度で判別できました。

次に、米スタンフォード大学とカナダのトロント大学の研究チームは、アルコールを飲んだ状態、スマホで早口言葉を録音するという実験を行い、2023年11月に「Journal of Studies on Alcohol and Drugs」という科学ジャーナルに論文を掲載しました。

https://www.jsad.com/doi/full/10.15288/jsad.22-00375

18名の実験参加者は、早口言葉をスマホで録音し、その後体重に合わせたアルコールを摂取します。一時間ごとに早口言葉を行うとともに、30分ごとにアルコール濃度も検査し、これを7時間続けます。研究では、音声からアルコール濃度を推定するプログラムを開発し、検査に利用しています。

その結果、アルコール濃度0.08%以上の状態について、なんと98%の精度で予測できました。日本では0.05~0.10をほろ酔い期ですが、道路交通法における酒気帯び運転に該当するのは血中アルコール濃度0.03%であり、より正確さが求められます。とはいえ、スマホで声を録音するだけで自分の酒量を測定できるこのプログラムは、例えばアプリにしたり、あるいは車にアプリを搭載し、きちんと話せなかった場合は車が動かない、といった仕様にするなど、他のサービスとの連携によっては、より効果を発揮すると考えられます。つまり、音声だけでなく、スマホや他のサービスと組み合わせることで、より効果を得られると考えられます。

もうひとつ、音声とAIを組み合わせることで、2型糖尿病(T2DM)をスマホから録音した音で診断する技術を、カナダの医療スタートアップ「Klick Health」のラボが開発しました。ラボの研究者たちは、2023年10月に論文(「Acoustic Analysis and Prediction of Type 2 Diabetes Mellitus Using Smartphone-Recorded Voice Segments」)を発表しています。

https://www.mcpdigitalhealth.org/article/S2949-7612(23)00073-1/fulltext

ちなみに、2型糖尿病とは、糖尿病の中でも最も患者が多い、タイプの糖尿病です。また論文によれば、世界中で推定1億7500万人が未診断の糖尿病患者であり、その累積経済的負担は2030年には年間約2兆1000億ドルに達すると推定されている、とのことです。

研究では、2型糖尿病患者とそうでない人、合わせて267名に対して、1日6回、決まったフレーズをスマホに録音します。これを2週間にわたって行い、計1万8465件の音声を収集します。

これをAIによって、人間では感知できないピッチの変化なども含めて分析。できあがったAIは女性89%、男性86%の精度で2型糖尿病かどうかを診断することができました。もちろん、実用化にはより大規模なデータ収集と分析が必要になりますが、それでも期待のできる数値です。

というのも、現状2型糖尿病は血液採取による診断が必要ですが、これを音声で代替できる可能性があるからです。あるいはそこまで行かずとも、疑いが場合に最初に音声を用いることで、ある程度の予測が可能になるでしょう。

このように、音声診断技術はまだまだ進みます。正確性に課題はあるものの、コストの面で優れていることから、実際に実用化され、市場で普及できるよう、期待したい領域でしょう。

この記事が気に入ったらサポートをしてみませんか?