見出し画像

『OpenAIとGoogleが発表しなかった「AIエージェント」』~【web3&AI-テックビジネスのアイディアのタネ】2024.5.17

先進テックで未来の生活はもっと良くなる!」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。

新規ビジネスのアイディアのタネがほしい方、未来を想像してワクワクしたい方、読んでちょっといいなと思った方、ぜひフォロー・高評価よろしくお願いします!


■次の主役「生成AIエージェント」、GoogleやOpenAIがまだ出さない怖い理由

 今週、2024年5月第3週は、米OpenAI(オープンAI)と米Google(グーグル)が相次ぎ、生成AI(人工知能)の新機能を発表した。しかし期待されながらもリリースされなかった機能があった。生成AIが様々なアプリケーションをユーザーに代わって操作する「生成AIエージェント」だ。

火曜日にはGPT-4oが発表され、翌日水曜日にはGoogleがGeminiの新情報を出した今週はAI関連でとても賑やかです。

でも確かに、「AIエージェント」についての発表はありませんでした。

直前にOpenAIがAppleと提携するだろうリークも出ていただけに、Siriの裏側がChatGPTになるのではないか、その発表が火曜に出るのではないかという憶測も流れていましたが、結局OpenAIからもGoogleからも「AIエージェント」についての発表はありませんでした。

上記記事は「なぜ発表しなかったのか?」を推測する記事で、さっくり結論を言うと「セキュリティ対策が現段階で不十分だからだろう」というものです。無料登録で全文読めますので元文を是非読んでみてください。


「AIエージェント」は何ができるのか?

何ができることが期待されるのか?が未だと正確な言い回しだと思いますが、上記の記事にはわかりやすい例が挙げられています。

2例ありますが、どちらもPCやスマホの画面を自動操作する前提で説明されています。

・ECで買った靴の返品手続きをAIエージェントにやらせる例

 具体的なユースケースとしては、オンラインショッピングで購入した靴を返品するシナリオを紹介した。この場合、ユーザーは生成AIエージェントへ靴の写真に添えて「この靴を返品したい」と指示すると、生成AIエージェントはユーザーのメールボックスからオンラインショッピングのレシートを検索して、その靴がどこで購入されたかを特定し、ショップで靴の返品処理を済ませた上で、配送業者が靴のピックアップに来る予定をユーザーのカレンダーに登録してくれるのだという。

・引っ越し直後の手続きをAIエージェントにやらせる例

 より複雑なユースケースとして、ユーザーが生成AIエージェントに「シカゴに引っ越してきたけど、何をしたらよいですか」と質問した際のシナリオも提示した。
 すると生成AIエージェントはユーザーの過去の行動履歴を考慮した上で「都市を探索する」「犬の散歩代行事業者を探す」「住所変更届を提出する」といった選択肢を提示。ユーザーが「住所変更届を提出する」を選択すると、生成AIエージェントは銀行や郵便局、オンラインサービス事業者など、住所変更を届け出る相手の選択肢を提示した上で、指示された実際の変更作業もユーザーに代わって処理してくれるとした。

この2つは、確かにできると便利ですし、なんとなくできるようになる道筋はイメージできます。

しかしWebサイトを人間の代わりに操作する手順をたどるやり方だと大変そうです。画面レイアウトを認識し、スクロール・ボタン押下・情報入力などをやるのは、決められた手順でAPIを使って手続きするより高難度です。

もう少し簡単な例もあります。

・「代わりに聞いといて」とAIエージェントに電話を取らせる例

AQUOS R9には、生成AIを活用した、電話の文字起こし機能が搭載されました。留守番電話の内容を、生成AIが文字を起こして、要約してくれます。これにより録音を聞かずに、電話の要点を素早く確認できます。AQUOSスマホとして初めて、生成AIを取り入れた機能です。

また、「代わりに聞いときます」機能も備えています。これは、着信があったときに機械の応答に切り替えられるというもの。知らない人からの着信で直接話すのをためらうときに便利に使えるとしています。

シャープの新型スマホ「AQUOS R9」には電話の文字起こし機能と「代わりに聞いときます」機能が搭載されるそうです。

おそらく「ただいま電話に出ることができません。ピーっという発信音の後にメッセージをどうぞ」の留守電機能に文字起こしが付いただけ程度で、実際に電話の相手とやり取りをして用件を聞きだす会話機能などはないだろうと思います。

期待される未来のAIエージェントは、優秀な秘書並みにやり取りしてくれる姿でしょう。初見の営業売り込み電話なら軽くあしらい、重要なクライアントならスケジュール調整してアポを入れるまでやってくれると最高です。


「代わりに〇〇しておいて」発想

これができるのは10年後なのか5年後なのか、ちょっと時間がかかりそうな気はしますが、「代わりに〇〇しておいて」はAIエージェントができるようになるだろうこと、できてほしいことをイメージするのに役立ちます。

上記の「代わりに返品しておいて」「代わりに引っ越し手続きしておいて」「代わりに電話に出ておいて」のようなかたちです。

「代わりに会議に出ておいて」「代わりに資料を作っておいて」などビジネスシーンでの「代わりに〇〇」はたくさんあります。

「代わりにプレゼンしておいて」の指示で、フェイク動画アバターがオンラインMTGで営業するAIエージェントも未来にはいるのでしょうか。

「先生の代わりに数学を教えて」は今でも結構やれます。法律でも薬の飲み合わせでもトレーニング方法でも、なんでも教えてくれます。

「代わりに運転しておいて」は自動運転です。車もスマホ化していますから、物理的にハンドルとアクセルを操作しなくてもバイワイヤーで操作できます。

「代わりに法律作っておいて」「代わりに裁判で判決出しておいて」はやりすぎでしょうか。今の国会の裏金問題などを見るとAI議員のほうがマシかもしれません。


人間は「楽になる」ことに抗えない

人間は「楽になる」方向のテクノロジーの進化には絶対に抗えなかったという過去の歴史を持っています。

AIエージェントは間違いなくいろんなものを楽にします。

「代わりに〇〇しておいて」は自分が楽になるためのマジックワードですから、技術が追いついて実現可能になれば、間違いなく普及します。


AIエージェントの時代はどこまできているのか

1.Reason=論理的思考能力。
2.Vision=マルチモーダル機能。コンピューターの画面を見て意味を理解する能力
3.Action=迅速に動くこと。音声ボットの電話の受け答えがタイムリーでなければ人間は電話を切ってしまうことだろう。

要約するとこの3点がまだ不足しているためにAIエージェントが実用化できていないとしていますが、先日のGPT-4oで「2.Vision」「3.Action」が大きく改善されました。

必要十分なレベルかは今後の検証が必要ですが、「1.Reason」の部分でさまざまなニーズと対応策を理解できるようになれば、今回挙げたようなAIエージェントに期待されることが実際にできそうな雰囲気が出てくるのではないでしょうか。

2024年の「イマココ」。来年はどうなっているんでしょうね。

この記事が気に入ったらサポートをしてみませんか?