見出し画像

【大革命】GAFAが音声技術領域に参入する理由とは!?音声技術はこれから伸びるのか。音声技術とビジネスについて解説してみました!!

こんにちは!PreVenture編集部です!

今回は音声技術について解説します。数年前から色々な議論が交わされており、一時は下火になったかに思えた音声技術ですが、ここに来て急激に成長しています。
Apple社のSiriやAmazon社のアレクサなどスマートスピーカーが各社で開発されています。また、インフルエンサーや著名人が配信していることでも話題となったVoicyなどの音声SNSも注目を集めています。
GAFAを始めとする大手IT企業が参入し、ベンチャー/スタートアップ企業も急増。なぜ音声技術がここまで注目されているのでしょうか?

今回の記事では、音声技術がビジネスにもたらす影響や私たちの生活にどのような変化を与えるのかについてご紹介しています。

音声技術とは

ぬっきー note3 (56)

音声技術とは、人間の声を識別し処理する技術全般のことを指します。一方、音声拡張は、人間の音声を拡張することを指します。認識した音声を大きく拡大、または聞き取りやすくすることで耳が不自由な人や聞こえにくい人の手助けをすることが音声拡張技術の目的です。

音声拡張も音声技術の一つです。他にも音声技術には様々な用途で活用されています。音声をテキスト変換したり、テキストを音声に変換することも音声技術に当てはまります。さらに最近は呼びかけに応答するなどの複雑な音声データの処理も可能になっています。

音声技術の仕組み

ぬっきー note3 (57)

音声技術は、人間が発する音波の最小単位である「音素」から判別しています。
認識した音素をもとに音素と関連付けられた膨大なデータベースの中から、適合する音素を認識、処理することでテキスト化しています。

音声を区別し、データとして分類する。そして既に蓄積されているデータと照合し、テキスト化する。さらに、入力された音声から、次のアクションや適切な応答に情報を変換し出力することも可能です。これらの技術は実用レベルまで発達していると言われています。

しかし、意訳や、本来の意味と異なる意味で利用された言葉への対応は難しいとされています。

音声技術は音の判別・データ化とそれに伴う、一般的な処理に優れています。

音声・言語認識の世界と日本での市場規模

ここで国内と国外の市場規模を確認します。国内と国外では、音声技術のニーズが少し違っています。日本国内では、業務の効率化と省人化の目的で音声技術が活用されています。
対して国外では、スマートスピーカーやー家電製品での音声技術のニーズが高まっているようです。

・音声技術の国内市場規模
株式会社矢野経済研究所の調査によると、国内の音声認識エンジン・音声認識に関連するソフトウェアおよびサービス、音声認識を利用するハードウェア等を扱う音声認識市場は、2020年度114億円2021年度は131億円になると予測しました。その中でも、コールセンターやコンタクトセンター分野が多くの割合を占めています。

理由として、非接触・非対面での顧客対応を実現するコールセンターの需要が高まったことがあげられます。さらに、人員不足の解消にもひと役かっており、音声認識市場の拡大は今後も伸びていくことが予想されています。

・国外の市場規模
世界の音声市場をみてみると音声・言語認識の市場規模は、2021年の83億ドルから21.6 %で成長し、2026年には220億ドルに達すると予測。220億ドルは、日本円にして約3兆7000億円にも及び、今後の成長も期待できるとされています。

国外では、スマートデバイスや家電製品への需要が高まっています。自宅で仕事をする機会が増えたことで、より快適な環境にしようと考える人が増えたことが原因です。

現在の家電製品には既に音声認識に対応している製品も登場しています。今後、AIの精度やデバイスがより普及することにより、これまで音声認識と関わりが薄かった人にも触れる機会が提供されると考えられます。

音声技術はどんな分野で活用されるのか

音声技術が、具体的にどのような分野で活用されるのかご説明します。

ぬっきー note3 (59)

インターフェースでの活用

音声技術の活用が最も期待される分野は、インターフェースでしょう。インターフェースとは、デバイスと人間との接点となるもののことです。SyntiantのCEO(最高経営責任者)を務めるKurt Busch氏は、「音声は、いわば“未来のタッチスクリーン”といえる」と語るほど、音声技術の将来性と利便性を絶賛しています。

生活に必要な家電などを自分自身の声ひとつで、操作できる利便性は既に多くの人が実感しています。音声制御の実現が難しいようなアプリケーションで、音声制御を実現することができれば、爆発的に普及する可能性も考えられます。

官公庁での活用事例

実際に、官公庁のホームページでは、音声合成ソフトが導入されており、ウェブ上のテキストをAIが読み上げてくれるようになっています。目に障害がある方だけでなく、違う作業をしながら文章を読み上げてもらうことに活用するなど、音声合成による読み上げは多くの人に幅広い価値を提供します。

音声技術が注目されている背景

なぜここまで音声技術が注目されているのでしょうか。ここでは音声技術が注目されている背景をご紹介します。

ぬっきー note3 (60)

AIの発達により進化した音声技術

音声技術が注目されている背景には、やはりAI技術の発達による認識スピード、精度の向上は見逃せません。不可能とされていたコンピューターによる音声認識が、AI技術の発達により可能になりました。ディープラーニングを行うAIと音声認識を組み合わせることで、より精度を高められることができた音声技術は、生産性、安全性、正確性の向上や働き方改革につながることが期待されています。

業務の効率化と省人化

会議の議事録を人間の代わりに記録したり、コールセンターではオペレーターとしての役割を担ったりするなど、業務の効率化や業務精度の向上に貢献しています。その結果、音声技術の導入により、働く人の負担を減らすことができ、従業員の労働環境改善にも繋がっています。

音声技術は人間の生活に役立つものとして、様々な用途での活用が期待できます。
その中でも特に、業務の効率化と省人化を実現する手段として注目が集まっています。

大手IT企業も参入

GAFAを始めとした、大手IT企業も次々と音声技術領域に参入しています。
例えば、Apple社のSiriやAmazon社のアレクサ、GoogleのGoogleアシスタントなど既に多くの商品・サービスが提供されています。これらの大手企業が参入する背景には、他の自社サービス・商品との親和性の高さに理由があると考えられます。

例えば、AppleやGoogleはスマートフォンやその他デバイス商品と連携させることができます。

自社商品が相互に連携することの利便性の高さが、自社商品を購入するインセンティブを高めます。そうすることで、一人のユーザーが複数の自社商品を利用することになりシェアの拡大が期待できます。さらに、スマートスピーカなど、音声技術の商品・サービスを使って生活することで、ユーザーの顧客情報を獲得することも可能です。

そうして得られた情報を、分析し現実にフィードバックすることで、商品開発やサービスの向上に活かすことができます。

このようにAIに支えられた音声技術はIT企業にとってユーザーとのインターフェースになる貴重な技術の一つとなっています。

音声技術により変化すること

ぬっきー note3 (61)

音声技術によって大きく変化する領域は、個人では「自動車産業」「自宅」「翻訳」、法人では「カスタマーサービス」「デジタルマーケティング」「議事録作成」などの分野でベンチャー企業が参入しています。

個人

①自動車産業
自動車産業は、音声技術によって人間の安全と利便性を叶えてくれるかもしれません。音声によるハンドル操作により、人間は完全にハンドルから手を離しミスのない安全、安心の自動運転が実現しようとしています。既に、ナビなどでは音声検索や案内を使用しているため、自動車と音声の相性は非常にいいと言えます。MaaSやスマートシティの先駆けとして注目される自動運転の実現にも音声技術は欠かせない技術です。

②自宅
音声技術が発達していることも最も身近に感じられるのは、IoTでしょう。IoTとは、通信機とネット環境がつながることで作られる暮らしのことを指し、自動で鍵を開けてくれるスマートロックなどが代表例です。暮らしと音声が融合することで、音声だけで全ての家電や身の回りの機器が操作できる時代はもう目の前まで来ています。

③翻訳
翻訳は、既に実用化できるレベルにまで到達しています。AIに日本語で話しかけると瞬時に翻訳するなど、言語を習得しなくても世界どこへでも行ける時代はもうやってきています。

④医療
成長産業として注目されている医療の分野でも、音声技術は活躍しています。音声技術を用いて省人化されシステム化されたオペレーティングシステムや、看病・介護のサポートを行うロボットなどにも音声技術は中核を担っています。

法人

①カスタマーサービス
カスタマーサービス領域で音声技術は活躍しています。コールセンターでは音声技術のみで対応する部分と、人が対応する部分を明確に分けることで、オペレーターを本当に必要なポイントに配置することができます。その結果顧客体験の向上にも繋がっています。

また、音声アシスタントによる接客やAIによって最適化された方法での営業活動も可能になります。ミスが起こる人間とは異なり、膨大な在庫データを記録させることで、スピーディーかつ正確性も保障されています。

②デジタルマーケティング
音声技術はデジタルマーケティングでも活用されています。音声検索の精度は、ほとんど正確に聞き分けるようになってきており、自分の手で入力するよりも音声入力のほうが早い場合もあります。SEOでも音声による最適化が求められてくるかもしれません。

③議事録作成
法人向けの音声サービスに議事録作成サービスがあります。議事録を会議と同時進行で記録することは簡単ではありません。入力ミスにより内容が分からなくなる、情報量が多すぎてどこが大切か分からなくなるなどの課題があります。しかし、音声技術により会議の内容を正しく作成・編集し、スピーディーに共有することが可能になります。

音声技術領域のベンチャー企業

これから市場として大きくなることが予想される音声技術領域において、日本の市場が世界と渡り合っていくためにはベンチャー企業の誕生・躍進は欠かせません。そこで、ここからは、日本の音声ベンチャー企業を5選紹介します。

株式会社CoeFont

ぬっきー note3 (62)

まずは、2020年11月に設立されたYellston。代表取締役は、東京工業大学に通う現役の大学生で、聞き取りやすい音声を低価格で提供することで、音声コンテンツ市場を盛り上げようとしてます。人工音声は、ゲームやニュース、YouTubeなどで使用できるため、低価格で提供することはユーザーの参入障壁を下げることに貢献しています。

株式会社BONX

ぬっきー note3 (63)

BONXは、コミュニケーションを円滑にする独自のヘッドセット「BONX Grip」を開発、販売しています。独自のヘッドセットを使用することで、最大10人まで同時接続が可能。人の声だけを認識し、外部の音は反応しないようになっている緻密な設計で、遊びから仕事まで幅広く使えます。

株式会社Empath

ぬっきー note3 (64)

日本初のグローバル・スタートアップEmpath。世界50か国の2,000を超える企業で使用されている音声感情分析APIを開発しており、音声の波の速さや大きさ間など、複雑な要素でできた波を分析することで、感情を含めた会話を可視化することができます。2017年創業にも関わらず世界へと羽ばたいているベンチャー企業のひとつです。

Hmcomm株式会社

ぬっきー note3 (65)

音声認識AIを担うスペシャリストHmcommは、国立研究開発法人産業技術総合研究所発のベンチャー企業です。既に、NTTなど大手企業にも導入実績を持ち、議事録の自動作成やコールの自動応対など業務削減・効率化に音声とAIを用いて挑んでいます。


フェアリーデバイセズ株式会社

ぬっきー note3 (66)

2007年に設立されたフェアリーデバイセズは、音声認識のソフトウェアから、置いておくだけでメモを取ってくれる「レコメモ」に使用される「Tumbler」という高性能マイクの開発まで音声技術を利用した問題解決までまるごと行ってくれます。日本の音声技術の最前線を走り、日本の技術力を世界に見せつけています。

まとめ

いかがだったでしょうか。国内・国外問わず注目を集めている音声技術ですが、その発展は個人から企業、業界・業種単位まで幅広く影響します。自動運転や、メタバースなどの仮想空間でも音声技術は欠かせません。また生活に音声技術が浸透すると、私たちの生活はさらに利便性を増します。このように音声技術は使い方次第で大きな可能性を秘めており、大手IT企業から、ベンチャー/スタートアップ企業まで多くの企業が参入しています。

最後に。。。

弊社では、転職前にベンチャー適性がわかる診断サービス「PreVenture」も運営をしています。40問の質問に答えるだけでベンチャー企業への適性診断を無料で受けることができます。ベンチャー/スタートアップ企業で働くことに興味がありましたらぜひ参考にしてみてください!


この記事が参加している募集

#業界あるある

8,656件

#仕事について話そう

110,645件

この記事が気に入ったらサポートをしてみませんか?