酩酊状態を声から診断するーー最新「声診断技術」の紹介

2023.2/17 TBSラジオ『荻上チキ・Session』OA

Screenless Media Lab.は、音声をコミュニケーションメディアとして捉え直すことを目的としています。今回は、病気の症状や酩酊状態を声から診断する技術について紹介します。

◾声でうつ病を診断する

AIを利用することで、声から様々な情報が理解できる技術が開発されています。よく知られているように、うつ病を動画や画像だけでなく、声から診断する技術の開発も進められています。声による診断は診断補助として活用される側面もありますが、声の診断は簡単で汎用性が高いため、病気の早期発見に役立ちます。

また、中国でもうつ病に苦しむ人は多いのですが、それに対して精神科医不足が指摘されています。そんな中、北京大学附属病院の研究者と企業によって、4万3000もの臨床会話の音声で学習したAIを利用した「うつ病診断ツール」の開発プロジェクトがはじまっています。2022年11月に発表した論文によれば、スマホに録音した30秒の声でうつ病診が可能となり、感度は82.14%、特異度は80.65%とのことです。

声は声帯や周波数、韻律の変化に加え、言語や感情といった複雑な情報を伝えるため、様々な分析が可能です。病気の早期発見の他、治療の面でも貢献できるでしょう。

◾コロナウイルス感染を声で検出する

また以前もお伝えしたように、声で新型コロナウイルス陽性かどうかを診断する技術についても、開発が進められています。

これまで、MITやケンブリッジ大学の研究チームがコロナウイルス陽性患者から声のサンプルを収集しており、このデータを用いてオランダの研究者がツールの開発に取り組んでいます。また10年に渡って咳の音から呼吸器系の疾患を診断するアルゴリズムを開発するオーストラリア企業「ResApp」は、昨年10月にファイザー社に約170億円で買収されています。

そんな中、米国立衛生研究所(NIH)、英オックスフォード大学、米ノースウェスタン大学等の研究者チームは2022年12月、ユーチューブから得られた話し手の声を分析し、新型コロナウイルスのオミクロン株に感染しているか否かを検出するモデルについて研究報告をしています。

研究チームは、オミクロン株の感染者、オミクロン株以前のコロナ感染者、コロナではない上気道感染にかかった人、そして呼吸器感染のない人たちの音声データを分析した結果、オミクロン株に感染した人とそうでない人を区別する特異度85%、感度80%との結果が出ました。またオミクロン株と上気道感染の区別も70%程度で可能でした。

この研究では、無症状の人のコロナ感染を特定するのは困難であるようにも思われます。その一方、音声を利用した診断は方法としては便利であり、やはり自らの声から特定の症状を発見するのに役立つように思われます。

◾飲酒状態を声で診断する

さらに声診断研究について、オーストラリアのラ・トロープ大学のアルコール政策研究センターの研究チームは2022年12月、飲酒したかどうかを声で判別するモデルについて論文を発表しています。

血中アルコール濃度の診断は息を吹きかけるものが一般的ですが、こうしたツールは高性能になるほど値段も高く、また息の吹きかけを拒否する場合もあります。

そこで研究では、飲酒した人とそうでない人、合わせて12360人の声のパターン(ドイツ語)をAIモデルを用いて分析しました。その結果、血中アルコール濃度0.05%(ほろ酔い期:日本酒1~2合)の人は67.67%で、血中アルコール濃度0.12%(酩酊初期:日本酒3合)であれば75.7%の精度で識別できました。研究チームは今後、性能向上とアプリ化を考えているとのことです。

日本の道路交通法における酒気帯び運転に該当するのは血中アルコール濃度0.03%であり、検出のためにはなお改良が必要になりますが、取り締まり目的の他、飲み会等で自分がどこまで酔っているのかを判断したり、飲食店が客の過度な飲酒を抑制するためにも、こうしたツール開発が求められます。

いずれにせよ、声による様々な診断技術は常に続けられています。今後も当ラボではこうした研究に注目したいと思います。

この記事が気に入ったらサポートをしてみませんか?