見出し画像

スマートスピーカーについて考えてみた

 Amazon、Google、Apple、LINE、など様々な企業が「スマートスピーカー」を続々と発売し、"ポスト・スマートフォン"と言われることもある存在となってきた。そんな中で、実際にスマートスピーカーを使った感想を含め、その展望などを考えてみたい。

<ポイント>
1.スマートスピーカーを実際に使った感想
2.音声認識デバイスの利点、欠点
3.今後の可能性

 まず、私がスマートスピーカーを使い始めて、約2ヶ月くらいが経とうとしている[2018年6月時点]。Alexa(AI技術のひとつ)が搭載されている、Amazon Echoを使っている。初期設定は難しくなく、Wi-Fi環境とPCやスマホといったデバイスがあれば簡単に始められる。その後、Alexaのスキルからスマートスピーカーを使ってやってみたいことなどを設定していく(←初期設定されているものもあるが、追加が必要なものもあるため、ここが少し時間がかかるかもしれいない点)。私が追加で設定したのが、RadikoとAWA STATIONだった。
 そして早速スマートスピーカーに向かって話しかけてみた。「Alexa、~して」という風に、"Alexa" という起動するスイッチみたいなものを必ず言わないといけない。ここで個人的に感じたのが、米国ではこのような操作に違和感はないのかもしれないが、日本では若干の抵抗感が出てくるのではないかと(慣れてくれば、そこも違和感なく感じるのかもしれないが)。
 基本的に、ラジオを聞いたり、AWAで音楽プレイリストを聴いたりする用途でスマートスピーカーを活用しているが、正直それ以外のスキルを追加していない現状なので、ただ音声認識というハンズフリーで操作が出来て便利というのが、今のところの感想だ。

 そのうえで、個人的に感じた音声認識の利点と欠点を2つ書いてみる。
 1.音声認識の精度
 2.発話という行為
 1つ目は、音声認識の精度が今一つに感じることが欠点として感じる大きな点だ。もしかしたら英語だとその精度は高く、便利に感じるかもしれない。英語と日本語とで、言語的な違い(発音やニュアンス)といったものがあるのは分かるが、きちんと発話内容を認識してもらえないことが多々あるため、それがストレスに感じることがある。
 2つ目は、発話をするということ自体が欠点になりかねない。これは、個人的には国民性や文化の違いが関係していると思うのだが、日本では"静"、反対に欧米では"動"といった意識の根底に違いがあるように感じる。確かに、何か別のことをしていて、音/音声で認識して別のことをしてくれるということは便利だ。ただ、そこが分かっていても、日本ではまだまだ浸透して慣習になっていくのには時間がかかると思われる。

 このように実際に使ってみた感想とそこから感じた利点と欠点をもとに、今後の展望を考えてみたい。そのうえで、つい先日発表された「Amazon Echo Spot」の存在は重要だと思う。

 既に米国では発売されている、スクリーン付きのスマートスピーカー。従来の、Amazon Echoでできていたこと(Alexaのスキル)に加えて、視覚的なこともできるようになる。例えば、動画レシピを耳だけで聞いていたAmazon Echoから、映像とあわせて情報を得られることができる(こうなるとスピーカーというより、映像デバイスとも捉えられるが)。また、今後の展望として、搭載されているフロントカメラを活用したコミュニケーションも実装していく予定とのこと。
 このように、スマートスピーカーは、単に従来のスピーカーの機能にAI技術を搭載しただけではなく、スピーカーという耳で聞くものを拡張させて、視覚的にも活用できるものにまで進化してきた。それにより、ますます出来ることが拡がってきた(Alexa スキルの)。
 今後は、冒頭で述べた他の企業、Google、Apple、LINEなどが、どのような動きをしてくるのか、注目していきたい。