見出し画像

第24回 音声のITについて

今回は少し変わったITについてお話します。
音声にまつわるITについてです。
 
ITの世界で音声の研究も古くからされてきました。これをボイステックといいます。
コンピュータに指示を出す、意思を伝えるのはキーボードでおこないますね。これはテキスト(文章、文字、単語)をキーボード経由でコンピュータに情報を伝えることです。
それに対するコンピュータの反応も、テキストが画面に表示される、あるいは画像や動画など画面に表示されるものでした。
一方、音声はどうでしょうか?音声で表現される、音楽が一つの例です。また、携帯の着メロとかもそうです。
 
ラジオの利点とはなんでしょうか?実はラジオは耳だけを拝借するメディアです。だから、仕事しながら聞けるんです。農家のかたは作業しながら、製造業とかもそうですし、ドライバーもそうですよね。
テレビは見ながらというわけにはいきません。
 
音声メディアというのはそういった、ながら視聴ができる、片手間コンテンツなんですね。また、配信のコストも動画に比べると安く容易になります。
1時間の動画の容量は1.1GBですが、音声だと30MBと3%弱なんですね。
そういったメリットが近年見直され、ボイステックが進んでいています。
 
ボイステックの主な例を挙げます。
ソフトウェア面では「音声アシスタント」「音声検索」「音声操作」
ハードウェア面では「スマートスピーカー」「ワイヤレスイヤホン」「ノイズキャンセリング技術」
ビジネス面では「サブスク型の音楽配信サービス」「音声コンテンツ配信プラットフォーム」「音声配信SNS」
 
具体的に例を挙げて紹介したいのですが、みなさん、Siriはご存知ですか?
iPhoneでヘイ、Siriと言ってから聞くと答えてくれるサービスです。
同じようにOK、Googleというのもありますね。
それでは、アレクサはご存知ですか?
 
アレクサは通販の世界企業であるamazonが提供するサービスです。先週お話したAIの技術が盛り込まれています。
スマホでもできるのですが、アレクサはスマートスピーカーというハードウェアでも提供されています。
 
これがそのアレクサのスマートスピーカーです。(持参した実物)
この丸いドーナツみたいのを自宅や事務所で、WiFiにつなぐことで、アレクサという秘書が誕生します。
 
今、このスピーカーはつないでいませんので、私のスマホでお見せしますね。
スマホでアレクサアプリを起動します。
 
アレクサで何ができるでしょうか?
 
基本的にいろいろな質問に答えてくれます。
天気とか聞いてみましょう。来週、東京に行くので東京の天気を聞きましょう。
 
なぞなぞも言ってくれますよ。
なぞなぞしよう。
これは音声認識と音声応答という技術が盛り込まれています。そこにクラウド上のAIエンジンが回答をうまく引き出してくれているんです。
 
スマートホームという言葉があるのですが、このアレクサを経由して、家電の操作が可能です。
帰宅したら、玄関で、アレクサ、電気をつけて、というと電気をつけてくれます。エアコン、照明、テレビなどのオンオフができます。
これは帰宅しなくてもスマホのアレクサに依頼するとエアコンつけてくれます。
 
私の場合もライトやエアコンのオンオフに使っています。ベッドに入ってから、あ、居間の電灯消し忘れたら、大き目の声でアレクサ消してといえばOKです。
 
アレクサはかわいい面もありますよ。アレクサ愛しているよーと言ってみますね。
 
ところで、今日は音声技術とAIを組み合わせたVoidol2というソフトを紹介しますね。これはクリムゾンテクノロジーという会社の製品なんですが、AIで特定の音声をリアルタイムにボイスチェンジしてくれるソフトです。
シンセサイザー機能でさらに変化を加えることができます。
 
これ、会社の留守番電話にも使えます。Youtubeも顔出しできないというのと同じように声出しできない、なんてありますよね。
動画でマニュアル作る時も、これで録音すれば声優さんのような声で音声入れられます。

この記事が気に入ったらサポートをしてみませんか?