見出し画像

音声AIの未来を切りひらく「対話型音声AI SaaS」とは?

こんにちは、対話型音声AI SaaS IVRy(アイブリー)CEOの奥西です。
IVRyはAI(LLM)を中心としたプロダクトを開発し、実際に販売をはじめて1年以上たっているAIプロダクトカンパニーです。

LLMを中心としたAIプロダクトを毎週のようにリリースしています
※参考:インフォグラフィックス2024

最近、「対話型音声AI SaaS」ってなんなんですか?と聞かれることも多く、また、NewsPicks様でインタビューいただいたこと機に、IVRyが注力する「対話型音声AI SaaS」という領域について、その可能性と未来を紐解いていきたいと思います。

本日投稿された記事はこちら↓

音声×AIの可能性

昨今、LLMの進化は画像やテキスト領域だけにとどまらず、OpenAIやGeminiを中心として、音声も含めたマルチモーダルな活用にも進化してきました。

LLMに至るまでの言語モデルの進化
参考: Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond(Fig.1)

また、。GPT-4oのナチュラルな会話デモ動画が話題となったのも記憶に新しいです。

このデモ動画からも妄想が膨らむように、音声×AIの組み合わせは、我々のコミュニケーションや情報活用の方法を大きく変えようとしており、具体的には、以下のようなカテゴリが挙げられます。

  • 音声認識:人間の声をテキストデータに変換する技術。議事録作成や音声検索などに活用されています。

  • 音声合成:テキストデータを人間の声に変換する技術。読み上げ機能やバーチャルアシスタントの声などに利用されています。ex: ひろゆきAI電話

  • 感情認識:声のトーンや抑揚から感情を分析する技術。コールセンターでの顧客対応やメンタルヘルスケアなどに活用が期待されています。

  • 対話型音声AI:人間と自然な対話を行うことができるAI。カスタマーサポートやスマートスピーカーなどに搭載されています。

また、音声AIの可能性については、シリコンバレーで著名なVCであるAndreessen Horowitzでも以下のような記事が書かれており、B2CおよびB2Bどちらのセグメントにおいても、テクノロジーの大きな変革点とOpportunityの存在を示唆しています。

対話型音声AI SaaSのプレイヤーたち

対話型音声AI SaaSは、企業が自社のサービスに音声AIを容易に組み込むことを可能にするクラウドサービスです。この領域では、今後もたくさんのプレイヤーが出てくると思いますが、現時点での代表的なプレイヤーをご紹介します。

LLM Platformer(OpenAI, Google etc)

皆さんご存知のとおり、LLM自体を構築し、音声やチャット・画像ベースのサービスやAPIとして、GPT-4oGeminiClaudeといった様々なモデルが提供されています。
アシスタントとして利用するのであれば、これらのどれかを活用しておくのが良いと思いますし、APIを活用してプロダクトに組み込む場合でも基本的にはこれらのAPIを活用して構築していくことが基本となります。

ちなみに、日本語だとGemini1.5 proがGPT-4oを抑えて性能TOPみたいです(2024/8/22現在)
※参照:https://chat.lmsys.org/?leaderboard

音声アシスタント(Google, Amazon, Apple etc)

馴染深いサービスでは、SiriやGoogle AssistantAlexaといったスマートデバイスも対話型音声AIサービスのひとつとなります。

バーティカル音声AI予約(ebica, Slang.ai, IVRy etc)

特に飲食店を中心として、国内ではAIスタッフ"さゆり"飲食店AI予約IVRy(アイブリー)であったり、グローバルではSlang.aiといったサービスが飲食店の予約受付を自動化するサービスとして有名です。忙しい飲食店での予約受付やキャンセルをAIが24時間365日、自動対応してくれることが売りです。

ホリゾンタル対話型音声AI SaaS(IVRy)

どんな業界・業種でも、安価に活用できる店舗・事業所向けAI SaaS IVRy(アイブリー)が存在します。電話の一次受付をAIが代行したり、飲食店の予約やキャンセルをAIが自動対応したり、FAQをAIが自動回答したり、注文をAIが自動で受付することも可能です。

対話型音声AI SaaSが実現する未来

上記のように対話型音声AI SaaSは、我々のライフスタイルやビジネスに大きな利便性をもたらし、より高いレベルでの社会実装が予想できます。

近い将来

  • カスタマーサポートの効率化:24時間365日対応可能な音声AIが、よくある質問に自動回答したり、複雑な問い合わせを有人対応にエスカレーションしたりすることで、顧客満足度向上とコスト削減を実現します。

  • パーソナルアシスタントの高度化:音声AIが、ユーザーの好みや行動履歴を学習し、よりパーソナライズされた情報提供や提案を行うようになります。

  • 音声操作によるデバイス制御:家電や自動車などを音声で操作することが一般的になり、 hands-free での操作が可能になります。

遠い未来

  • 自然な対話による言語学習:AIとの対話を通じて、外国語を習得することが可能になります。

  • メンタルヘルスケアのサポート:AIが、日常会話からメンタルヘルスの状態を把握し、適切なアドバイスや支援を提供します。

  • 音声による創作活動:AIが、音声による指示をもとに、音楽や絵画などの作品を生成します。

IVRyの目指す未来

IVRyは、「対話型音声AI SaaS」を通じて、人々の生活をより豊かに、ビジネスをより効率的にすることを目指しています。
私たちは、音声AI技術の進化を加速させ、誰もが簡単に音声AIを活用し、働く人々が自分自身のやりたい仕事に集中できる世界を実現していきます。

音声AIの未来は、無限の可能性とテクノロジーの大きな変革点を秘めています。
日本や世界のすべての人々が、AIと共に働き、共に生きる世界を1秒でも早く実現し、生産的で楽しい未来の実現を推進していきたいと思います。

P.S.
IVRyは全ポジション採用募集中です!
気軽にカジュアル面談やご応募お待ちしています!


この記事が気に入ったらサポートをしてみませんか?