見出し画像

音声認識ってそもそも何?オススメの活用法と今後の変化まで!

今回は音声技術の中でも、「音声認識」について取り上げたいと思います。

音声認識とは?

最近は、テクノロジーに明るくない人にでも音声認識という言葉は当たり前のように使われるようになってきました。

ご存知の通り、音声認識とは、人の話した音声を文字に変換する機能のことです。Speech to Textとも呼ばれます。広義では、誰が話しているのか、その話者を特定する機能のことも指すそうです。

今回は、Speech to Textについて書いていきます。

さて、音声認識というとどのようなイメージでしょうか?

日本人は、音声認識サービスが出始めの頃に携帯会社のサービス等で利用したせいもあり、音声認識の性能に懐疑的な方が多いようですね。

実は現在の音声認識の精度は95%ともいわれています。(日本語は同音異義語が多く、難易度が高いので、もう少し精度は下がるかもしれません。)

95%というと、もはや人間の聞き取り精度を上回っています。人間でもよく聞き間違いはありますよね?

最近では、Siriの登場や、スマートスピーカーに代表されるような音声アシスタントの普及により、かなり身近になってきているので、音声認識を日常から使っている人も多いかと思います。

音声認識って本当に使えるの?と考えている方は是非一度使ってみてください。一昔前のような音声認識をイメージしていると、その精度に驚くと思います。

オススメの活用方法!

そんな音声認識ですが、一体どう活用すれば良いか??

アメリカでは、音声アシスタントがかなり普及していて、多くの家電が音声アシスタントに対応しています。インターネット検索をする際の50%近くが音声による検索だそうです。

音声による操作のメリットは、何と言ってもハンズフリー、アイズフリー(目を離していられる)ことです。

アメリカでこれだけ音声アシスタントが普及しているのは、日本以上に車社会であることが挙げられるようですね。国民性に依るところもあるとは思いますが。

日本だと音声検索はあまり普及していないですし、外でSiriに話しかけている人もあまり見かけないので、まだ少し抵抗があるかもしれません。

そんな我々が音声認識をどう活用するか?

個人的には、ブログ等の文章を書く人は、音声認識はオススメです。

僕自身もある程度書く内容が決まっている時には音声入力を利用することがあります。

音声認識サービスはいろいろありますが、個人的にはGoogleドキュメントの音声入力が便利だと思います。

無料で利用できますし、認識精度も高いです。静かな環境だと、8〜9割くらいは正確に聞き取ってくれるイメージですね。

音声入力の良いところは、なんと言ってもスピードですね。もちろん個人のキーボード入力のスピードにも依りますが、大半の人にとっては、キーボード入力より早いと思います。

大まかな部分を音声入力した後に、キーボードで細かい部分を編集していくと作業スピードが上がるのではないでしょうか。

あとは手放しでできることですね。他の作業をしながらでも音声入力が可能ではあります。集中できないので、僕はあまり利用しませんが。

ブログや長文を書くことがある人は、是非試してみてください。

これから音声認識はどうなる?

今でも十分便利になりつつある音声認識ですが、今後はどのように進化していくでしょうか?

先にも述べたように、音声認識の精度としては既に人間を超えています。

これからは、より厳しい条件下での音声認識が可能になってくるでしょう。

・騒音環境下での音声認識
・障害等で上手く話せない方の音声認識
・話者認識と組み合わせた議事録機能

なんかが人気のトピックでしょうか?

さらには、囁き声や、言葉を発しようとするときの顎の神経信号を文字に変換する研究もされているようです。もはやテレパシーのようですね。

株式会社voicewareでも、よく相談を受けるのは議事録を自動化できないかということですね。話者まで記録したいとなると、実用レベルはもう少しと言ったところでしょうか。まだ数人程度の聞き分けしかできないのが現状のようです。マイクを複数用意したりして、なんとか実現している例はあるようです。

あとは、昨今のプライバシー意識の高まりから、クラウドサービスを利用したくないというケースもよく聞きます。

企業なんかだと、GoogleやAppleなんかにあまりデータを取得されたくないという思いは強いようですね。

株式会社voicewareでもクラウドサービスを利用しない、自社で構築可能な音声認識サービスは検討中です。


さて、ここまで音声認識について書いてきましたが、ここで挙げたのはほんの一例です。今は音声認識を利用したサービスはめちゃくちゃ多く存在します。

音声技術がより身近になって、便利な世の中になっていくのは、とてもワクワクしますね!

僕自身も音声技術を通して、より便利でエキサイティングな世の中を創ることに貢献していきます!


株式会社voiceware
代表取締役CEO 田村一起
http://voiceware.co.jp/

この記事が気に入ったらサポートをしてみませんか?