見出し画像

AIボイスエージェントによる激動のビジネス変革

AIとの音声インターフェイスにより、BtoB、BtoCの両面において、さまざまなビジネス活用の取り組みが進んできました。その多くは細やかで複雑な設計が必要なものでしたが、直近GPT-4oの登場で変革の時を迎えようとしています。

こうした状況下で、著名なVCであるアンドリーセン・ホロウィッツ(a16z)が2024年5月29日に発表した記事の要約を中心に、一部独自の見解も加えながらまとめたいと思います。


ビジネスにおけるAIボイスエージェントの利点

時間と労力の節約

AIボイスエージェントは、人間のコールスタッフの時間と労力を大幅に削減します。これにより、従業員はより重要な業務に集中することができます。

リソースの再配分

AIボイスエージェントの導入により、企業はリソースを再配分し、収益を増やす可能性があります。コールセンターの運営コストを削減し、その分を他の重要な分野に投資することができます。

一貫したコンプライアンスと顧客体験の提供

AIボイスエージェントは、常に一貫した対応を提供し、コンプライアンスを遵守します。これにより、企業はリスクを低減し、顧客満足度を向上させることができます。

消費者にとってのAIボイスエージェントの利点

AIボイスエージェントは、実際の人間との「マッチング」なしで、人間並みのサービスを提供します。現時点では、セラピスト、コーチ、コンパニオンなどが含まれていますが、将来的には、これがボイスを中心としたさらに幅広い体験を含むようになるでしょう。

ボイスエージェントの構築方法

フルスタック vs. 自己構築

ボイスエージェントの構築にあたっては、フルスタックプラットフォーム(例:Retell、Vapi、Bland)でエージェントを立ち上げるか、自らスタックを組み立てるかを選ぶことができます。

AIボイスエージェントの構築(参照記事より引用)

音声エージェントが機能するためには、人間の音声を取り込み(ASR)、この入力をLLMで処理して出力を返し、人間に話し返す(TTS)必要があります。
一部の企業やアプローチでは、LLMまたは一連のLLMが会話の流れや感情を処理します。他のケースでは、感情を追加したり、中断を管理したりする独自のエンジンがあります。フルスタック音声プロバイダーは、これらすべてを1つのパッケージで提供します。

AIボイスエージェントの構築に関連するサービス(参照記事より引用)

予想される大変化

しかし、GPT-4oのような新しいマルチモーダルモデルは、1つのモデルを介してこれらのレイヤーのいくつかを同時に「実行」することで、スタックの構造を変えるかもしれません。これは、レイテンシーとコストを削減し、より自然な会話インターフェイスを実現する可能性があります。

BtoBエージェントにおける論点

LLMベースだが、初期段階では必ずしも完全に自動化されているわけではない。

AI音声エージェントの「強い形態」は、完全にLLM駆動の会話であり、インタラクティブ・ボイス・レスポンス(IVR)や電話ツリーのアプローチではありません。しかし、LLMは完全に信頼できるわけではないため、センシティブな取引や大規模な取引には一時的に「人間の介入」が必要となることがあります。これは、垂直特化のワークフローが成功の確率を最大化し、人間の介入を最小限に抑えるために特に重要です。

カスタムモデルのチューニング vs. LLMのプロンプティングアプローチ

B2B音声エージェントは、一般的なLLMでは対応が難しい専門的な会話をナビゲートする必要があります。多くの企業は、数百から数千のデータポイントを使用して顧客ごとにモデルをチューニングしています。ある企業は、特定の使用ケースに対して「一般的な」モデルをチューニングし、その後顧客ごとにプロンプトを使用することもあります。

ドメイン専門知識を持つ技術チーム

その複雑さから、高品質のB2B音声エージェントを立ち上げ、スケールするには、ある程度のAIのバックグラウンドが役立つでしょう。しかし、製品をパッケージ化し、垂直市場にどのように浸透させるかを理解することが同様に重要であり、これはドメイン専門知識や強い関心を必要とします。

統合およびエコシステムに対する明確な視点

上記と同様に、各垂直市場の顧客は、購入前に特定の機能や統合を確認したいと考えています。これにより、製品を「有用」から「魔法のようなもの」に昇華させることができるかもしれません。このことは、垂直市場に特化して始めることが理にかなっているもう一つの理由です。

「エンタープライズグレード」または強力な製品主導の成長(PLG)モーション

収益が上位の企業やプロバイダーに集中している垂直市場では、音声エージェント企業はまず大企業向けにサービスを展開し、最終的には中小企業向けへと広げていくかもしれません。

BtoCエージェントにおける論点

音声が必要な理由についての強い見解

音声が製品にどのように独自の価値をもたらすかについて考えることが重要です。多くの場合、音声インターフェースはテキストインターフェースと比べて情報の消費や抽出が不便なため、実際にはマイナスになることが多いです。

リアルタイム音声が必要な理由についての強い見解

なぜ製品がリアルタイム会話を中心に構築される必要があるのかについて考えることが重要です。例えば、人間のような仲間としての役割や、練習環境などが考えられます。

実物そっくりでないプレAI製品

強力な製品は、単に人間同士の会話をそのままAI音声エージェントに置き換えたものではない場合も考えられます。AIを活用することで、同じ価値をより良く(より効率的に、より楽しく)提供するチャンスがあります。

モデルの品質が勝者を決めないほどの垂直特化

主要な一般消費者向けAI製品(ChatGPT、Pi、Claude)は、高品質な音声モードを持っています。これらは多くの種類の会話やインタラクションに意味のある対応が可能です。そして、近い将来、これらは自社のモデルとシステムを運用することで、遅延の削減や会話のスムーズさにおいて優位に立つ可能性が高いです。

サービス事例リスト

同記事内では、AIボイスエージェントに関連する企業群について、カオスマップとして公開されていました。今回、AIビジネスラボは、その企業群を一つのリストとして独自にまとめました。下記リンクより、ご覧いただけますので、ご活用いただけますと幸いです。

AIボイスエージェントサービスリスト

AIボイスエージェントサービスリスト(AIビジネスラボ作成)

BtoBエージェント(アプリ)のサービス事例

以下は、記事内に掲載されていたBtoBエージェント(アプリ)のカオスマップです。

B2Bエージェントマーケットマップ(参照記事より引用)

全体的な傾向

  • 多様な業界への適用: ローカルビジネス、ヘルスケア、リクルーティング、レストラン、トレーニング、金融/保険、ホスピタリティ、セールス/サポートなど、多岐にわたる業界で活用されています。

  • 効率化と自動化の推進: 各業界での主な利用目的は、業務の効率化、人件費の削減、顧客サービスの向上です。特に、予約受付、問い合わせ対応、注文処理、保険確認、採用面接などの日常的なタスクの自動化が目立ちます。

  • カスタマイズとスケーラビリティ: 多くの企業がカスタマイズ可能なAIソリューションを提供しており、企業の特定のニーズに応じた音声エージェントを構築しやすい仕組みを整えています。

業界別の特徴

  • ローカルビジネス: 予約受付や問い合わせ対応など多様な電話応対業務を自動化し、業務効率化と人手不足解消を実現しています。

  • ヘルスケア: 予約のスケジューリング、処方箋の補充、患者リマインドなど、医療関連のタスクの自動化が進んでいます。患者の安全性を考慮した設計が特徴です。

  • リクルーティング: 候補者のスクリーニング、面接の日程調整、採用面接の自動化など、採用プロセス全体を効率化するためのソリューションが提供されています。

  • レストラン: 注文受付、ドライブスルー対応、顧客対応の自動化などにより、注文ミスの防止や顧客対応の効率化を図っています。

  • トレーニング: シミュレーション形式でスキル習得を支援するトレーニングプラットフォームが提供されており、特に営業職向けの商談シミュレーションが注目されています。

  • 金融/保険: カスタマーサポート、保険確認、請求手続きの自動化などにより、顧客満足度の向上とコスト削減を実現しています。

  • セールス/サポート: 自然な会話での顧客対応、リード獲得、営業・サポート業務の自動化により効率化と顧客満足度を向上します。

また、今後のBtoBボイスエージェントの展開を、「ROI」と「特化vs汎用」2つの視点で考えてみようと思います。

ROI視点

AIボイスエージェントの導入には、記事執筆時点では依然大きなコストが生じます。そのため、ROI算定を含め、経営へのインパクトは定量化した上で導入の可否を判断するのが望ましいです。

①コスト削減効果:
これは比較的単純で、AIが電話を受けたり、店舗やアプリサービスなどで注文を受けたりすることで、その分の人件費を削減できるというものです。また、例えばコールセンター内部でのロールプレイを高度化、自動化できるなど、研修コスト削減なども見込める可能性があります。

②収益機会向上効果:
AIボイスエージェントは、24時間365日稼働することができるため、本来は営業時間外で取りこぼしていた売上の獲得が期待できます。また、人は同時に1つの回線でしか通話できませんが、AIボイスエージェントはサーバーの許す限り無限に回線を増やすことができます。また、多言語対応も可能なため、世界中の顧客を獲得することも可能です。

③リスクファクター:
AIによって、例えば応答品質を均質化したり、コンプライアンスなどをあらかじめ遵守されるよう組み込むことで、従業員によるヒューマンエラーを軽減可能です。しかし、AIボイスの品質によっては顧客を不快にさせたり、ハルシネーションなどにより誤った情報を伝えるなど、新たに生じるリスクには十分な防止策を講じる必要があります。

特化型か汎用型か

カオスマップを見て分かる通り、現状は業種業態ごとにサービス展開がされていることが多いです。これは、業界のドメイン知識を活かしたシステム実装が求められたり、外部ツール(例:予約管理ツールや営業支援システムなど)との連携などが必要となるためです。
しかし、今後一層の汎用エージェント化が進行する過程で、特化型サービスに依存してブラックボックスになっている部分がリスクとなることもあるため、将来的な業務設計を考慮した上での導入判断が重要です。

BtoCエージェント(アプリ)のサービス事例

以下は、記事内に掲載されていたBtoCエージェント(アプリ)のカオスマップです。

BtoCアプリマーケットマップ(参照記事より引用)

全体的な傾向

  • 業務の自動化と効率化: 多くの企業がAIを活用して日常業務を自動化し、効率化を図っています。特に教育、カスタマーサポート、セラピーなどの分野で顕著です。

  • パーソナライズされた体験: AI技術を活用して、個々のユーザーに合わせたパーソナライズされた体験を提供することに焦点を当てています。

  • 広範な業界適用: 教育、メンタルヘルス、ビジネス支援など、様々な業界でAIボイスエージェントが利用されています。

  • インタラクティブ性の強化: 多くの企業がインタラクティブなAIエージェントを提供し、ユーザーとの自然な対話を目指しています。

業界別の特徴

  • EdTech (Adults): 英語学習や就職面接準備のためのAI音声エージェントを提供し、語学力向上と実用的なスキル習得を支援しています。特に、音声認識技術やインタラクティブなレッスンが特徴です。

  • EdTech (Kids): 子供向けのAI家庭教師や読書アシスタントを提供し、個別指導や楽しい学習体験を通じて学習能力を向上させます。教育ゲームやアニメキャラクターを用いた指導が含まれます。

  • Companion: パーソナルAIコンパニオンを提供し、ユーザーとの深いインタラクションや感情的サポートを行います。自分だけのキャラクターを作成し、成長させることができる点が特徴です。

  • Therapy: AIメンタルヘルスセラピストや感情的ガイダンスを提供する音声アシスタントが、ユーザーのメンタルヘルスをサポートします。認知行動療法に基づいたサービスも存在します。

  • Coach: 面接準備やスキル向上のためのAI面接官を提供し、リアルなシミュレーションとフィードバックを通じてパフォーマンスを向上させます。

praktika.ai - AIアバターによる1対1の家庭教師

面接をロールプレイするAIを提供することで、就職面接の準備を支援し、また、個人スコアや改善のヒントを通じて実際の面接のような対話を維持し、学習者がAI言語フィードバックを受け、言語スキルを向上させるヒントを得ることを可能に。

Amira Learning - インテリジェント読書アシスタント

語彙力、流暢さ、理解力の向上を支援する読書アシスタント。発達段階にある読者の評価とコーチングを支援し、カリキュラムに基づいた測定評価を自動的に実施することで、教師は幼い生徒の口頭読解の流暢さを定期的に追跡することができ、また教育者には生徒の成績に関する詳細なデータと、個別指導や少人数指導の指針となる指導上の推奨事項を提供する。

さいごに

抽象化が求められる用途では文字ベースでの情報伝達が重要ですが、日々の意思疎通においては会話の方が高効率です。今後、ボイスエージェントが人と区別がつかないほど便利になると、AIの社会実装も想定以上に加速していくことが考えられます。

私たちは、具体的な課題解決や最適なユースケースの提案、費用対効果(ROI)を重視した計画の策定、スムーズな導入と運用サポートを通じて、AIが実社会に具体的な利益をもたらすための取り組みを進めています。

ご質問等ございましたら、メール(ai.business.laboratory@gmail.com)または、記事執筆者の水野(Xアカウント: @kakerumiz)、納村(Xアカウント: @akinoriosamura)までお気軽にお寄せください。

この記事が気に入ったらサポートをしてみませんか?