見出し画像

今,流行の「AIエージェント」って何?

 AI業界で今一番話題になっているものに「AIエージェント」があります。

 この「AIエージェント」は来年ブームとなり、注目がますます高くなっています。その理由を、簡単に説明していきましょう。


生成AIがビジネスであまり使われていない理由


 そもそも、なぜ今、AIエージェントに注目が集まるのか?

 それは、現時点でのCHAT-GPTなどの大規模言語モデル(LLM)を仕事で利用する場合、期待するほどには業務効率化ができないからです。

 「えっ」と意外に思う人も、「そう、その通りなんだよな」とうなずく人もいるでしょう。

 OpenAIのCHAT-GPTや、 GoogleのGEMINなど、大規模言語モデル(LLM)と呼ばれる生成AIが社内で導入されている、という方は多いと思います。

 そして、大半の企業では、生成AIは20%程度の社員にしか使われていないが現状です。

 なぜ使われないのでしょうか?

 それは、プロンプトを工夫して入力しなければいけないなど、使うのが意外に面倒な割には、それほど業務が便利にならないからです。


プライベートとビジネスではAIの使い方は違う

 SNSでは、生成AIの使い方やプロンプトの入力方法、テンプレートなどが紹介されていますが、ほとんどが、インターネットにある情報や、生成AIがあらかじめ学習した情報をもとに、何かをさせる方法が紹介されています。

 これらの大半は、どちらかというとプライベートでの使い方がメインです。もちろん仕事用のプロンプトの書き方も数多くありますが、総じて、大半はプライベートユースです。

 プライベートでの生成AIはとても便利ですよね。僕も、通勤電車の中や歩いている時などで、毎日3時間ほど使っています。

 例えば

・YouTubeの内容を要約してもらうことで、短時間で多くの情報を得る
・人に聞いたりして知らなことがあったら、とにかく質問する
・音声で雑談相手、アイデア出しの壁打ち相手になってもらう
・ブログ用の画像を作る …etc

 進化の早い、毎日ニュースがある、生成AIをビジネスにしている関係上、僕はYouTube動画を毎日50本ほど、情報収集のために見なければなりません。1本20分として16時間は必要で、時間的に無理が出てきていました

 ですので、最近は、YouTubeの動画を見るのではなく、生成AIを使って、僕の見たいYouTube動画を毎日要約して、僕の知りたいポイントを書き出して纏めさせています。

 これにより、僕は毎日、50本分の動画のまとめを、1時間ほど読むことで、動画50本を見る必要がなくなりました。

 16時間が1時間になったのです。これなら毎日情報収集できますよね。生産性爆上がりです!

 もう、生成AIなしには、僕は生きていけません(笑)

 こんなにも生成AIは便利になっているのですが、それでも、仕事で使うには、まだまだ使いにくいのです。その理由を簡単に説明しますね。


ビジネスでの生成AIの利用方法

 仕事で、僕がプライベートで生成AIを使うようなこと、例えば、画像を作ったり、ブログを書いたり、は、しません。せいぜいアイデア出しとか、調べ物、会議の文字起こし、ぐらいです。

 ビジネスの現場では、毎日、社内の情報やデータ、社内のシステムを使って、大半の仕事が実行されています。

 たとえば、社内のメールシステムでメールを送受信する、客先向けのプレゼン資料を作成する、過去の議事録から会議資料を作成する、勤怠を人事システムに入力する、会計システムにタクシーの領収書情報を入力する、などを誰もが毎日しています。

 これらは、社内システムを使って、社内や自分の情報や文章をもとにする仕事ですよね。

 こうしたことはCHAT-GPTではできないのです。

 なぜなら、CHAT-GPTはネットで公表されていない社内システムの中の情報は知らないし、アクセスもできないからです。

 そういうわけで、現状、企業での生成AIをどのように利用しているかというと、RAGと呼ばれる生成AIの機能を使って、社内の文章の情報(データーベース)を検索して取り出すシステムを開発・導入しています。

RAGの仕組み

 こうした仕組みは、大半の企業で、すでに導入されています。


ビジネスで生成AIが使われてない理由

 しかし、前述の通り、利用者は、特別な会社を除くと、上場企業であっても、社員の15%〜25%程度です。

 なぜでしょうか?

 それは、この仕組みで社内の文章情報を検索して取りまとめても、それほど業務効率が爆上がりしないからです。

 多くの企業では、生成AIの利用率を高めるために、教育はもちろんのこと、活用方法の情報共有や、利用方法のコンテストの開催、業務用のプロンプト事例(テンプレート)の配布など、涙ぐましい努力を続けています。

 しかしながら、仕事が劇的に便利にはならないため、利用率は、なかなか上がらないのです。 

 僕が毎日、プライベートで生成AIを使うのは、劇的に便利であることを体験、腹落ちしているからです。

 YouTubeの動画を生成AIが要約することで、情報収集の時間が1/16に短縮されるなど、劇的な効果が出れば、絶対に使いますが、単に生成AIを導入して、RAGを入れただけでは、劇的な業務改善は見込めないのです。

 RAGを導入して、CHAT-GPTをRAGの仕組みで使えるシステムを導入して、社内の文章を検索して内容を要約したりしてくれるのにも関わらず、業務効率が上がらない理由はなんでしょうか?

 例えば、メールの返信文を書いてとAIにお願いしても、その文章で返信できるほど完璧な文章を、AIは書いてくれませんよね?

 何か買いたい時に、上司に稟議書を作成して送るにも、社内の言葉や文化をふまえた稟議書をAIは書いてはくれませんし、稟議書を回すこともできないですよね?

 結局、自分で書いた方が早い、となります。これでは使いません。

 端的にいうと生成AIを仕事に使うには「すべてが中途半端」なのです。

 中途半端なので業務効率がそれほどはあがらない
  → 業務効率が劇的にはあがらない(便利でない)から使わない

 そういういうことです。シンプルな理由ですが、これでは困ります。

 そこで登場したのが「AIエージェント」です。


AIエージェントとは


 AIエージェントとは、AI、つまり人工知能を活用して、特定のタスクを、半自律的に実行するプログラムやシステムのことです。

 これだけ聞いても、ん?って感じですよね。

 わかりやすい例を書いてみます。

 例えば、会社で、取引先と打ち合わせをするのに、参加者の予定を調整して、取引先に候補日時を連絡する、といったことは、仕事をしていると毎日ありますよね。

 これって結構面倒なことです。

 これをAIエージェント機能を持ったAIに、「僕とX君、Y君の3人で、取引先のA社のZさんと打ち合わせしたいのでスケジュール調整して」 と「タスク」を依頼すると、次のようなことをAIがしてくれるイメージです。

(1)会社のスケジュール管理システムにアクセスする
(2)直近2週間の僕、X君、Y君の空いているスケジュールを探す
(3)3人ともに空いているスケジュールの日時を探す
(4)僕のメールボックスの中にあるA社のZさんとのメールを探す
(5)Zさんのメールアドレスを取り出す
(6)3人の空きスケジュールを伝える会議依頼のメール文を作成する
(7)Zさんに作成した会議依頼のメールを送信する

 こうした一連のタスクを、「スケジュール調整して」とお願いするだけで、AIが何をすべきかを自律的に考えて実行するのがAIエージェントです。

 こうしたスケジュール調整など面倒な仕事を、時間をかけることなく、AIに頼めば勝手にAIがスケジュール調整をやってくれるとなると、AIを使いたいと思いませんか?

 しかし、今の生成AI(大規模言語モデル)+RAGの仕組みでは、そこまではやってくれないのです。

 なぜなら、生成AIは、「A社との打ち合わせをセットをして!」と言われても、A社って何だかわからないし、社内のメールやスケジューラーも見れませんし、メールすら社内システムにログインして送ることすらできません。

 要は、生成AI単独では、こうした、一気通貫の業務を自動的にやることはできない=業務効率があがらなのです。

 つまり、生成AIは、文章を検索していい感じの文章を作成するという今の機能に加えて、メールやスケジュール管理のシステム、会計システム、など、AI以外のシステムと連携して、業務を自動実行することができなければ、仕事で使えません。

 そのため、今、各ベンダーがこぞって、こうした、システムとの連携ができて、タスクを自動的に行えるような機能を開発しています。

 これがAIエージェントなんですね。


AIエージェントに必要なこと

 AIエージェントの基本的な特徴として、自律性、反応性、社会性の三つが挙げられます。

(1)自律性

 自立性とは、人間の介入なしに自ら判断し行動する能力を意味します。例えば、先ほどのスケジュール調整も、「A社とスケジュール調整して」と指示するだけで、AIがスケジュール調整するとはどういうことか?を考えます。

 そして、何をすべきかのタスクを洗い出し、自律的に、社内メールやスケジュールのシステムの情報を読んで、メールを作成して送ることができないと、便利にはなりません。ですので、自律的に考えて行動する力がAIに必要になってきます。

 要は「1言えば10わかる」でないと便利にならないのです。

 最近AIが推論能力を身につけてきたので、自分で考えることができるようになってきましたので、自律的に考え、動ける頭は持ち始めています。

(2)反応性

 反応性とは、環境の変化に応じて迅速に対応する能力で、スマートフォンの音声アシスタントがユーザーの質問に即座に応答することが例として挙げられます。

 iPhoneのSiriに「ヘイ、Siri!」と話しかけた瞬間に応答が始まりますが、こうしたことができないと、僕たちの要求に即座に反応して、タスクを実行できません。

 車の自動運転だと、この反応性がないと、ぶつかってしまいますよね。

3)社会性

 社会性とは、自分以外のシステムやAIと協調して動ける能力です。

 前述した通り、生成AI単体では仕事は完結しません。周りの社内の業務システムや、今後増えてくる他のAIエージェントなどと連携して、タスクを遂行しないと、業務は完結しません。

 ロボットで言うと、『攻殻機動隊』のタチコマが、他のタチコマ達と、お互いに相談してタスクを実行するイメージですね。

AIエージェントの開発状況

 AIエージェントは、次世代の生成AIの勝ち筋なので、ベンダー各社が現在こぞって開発を競っています。

 Anthropic社のAI「Claude 3.5 Sonnet」に新機能の「computer use」がベータ版で先月登場して話題になっていますね。

 僕も使ってみて、完璧には動きませんが、すごいなぁと思いました。

 
 OpenAIも、2025年1月に「Operator」というAIエージェントをリリース予定ですし、マイクロソフトも今年中に「Copilot Studio」サービスでエージェント機能を企業ユースに提供するに加えて、さらに先進的なAIエージェント「Magentic-One」のリリースを予定しています。

 こうした動きや、具体的に、どのようにしてAIエージェントが動いているのかについては、長くなりますので、次の記事で書きたいと思います。





いいなと思ったら応援しよう!

この記事が参加している募集