この動画では、強力なAIモデル「ToolLLM」について紹介されています。このモデルは実世界のAPIと連携でき、Google MapsやSpotify、Twitterなどのサービスを操作します。ToolLLMは、大規模データセット「ToolBench」から学習し、16,000以上のAPI情報を持っています。このモデルはユーザーの指示を解析し、適切なAPIアクションを決定し実行します。既存や新しいAPIも学習でき、gorilla AIモデルより高度な機能を持ちます。多くの分野での活躍が期待され、オープンソースとして進化が期待されています。しかし、使用する際には倫理的な側面も考慮する必要があります。
公開日:2023年8月18日
※動画を再生してから読むのがオススメです。
AIの世界に激震が走った。
ToolLLMは単なるAIモデルではなく、有名なゲリラAIモデルを凌駕するタイタンなのだ。
ToolLLMはゴリラの10倍パワフルだ。
つまり、10倍のAPIを持ち、他のモデルにはない能力を持っている。
このビデオでは、この非常識なモデルの詳細、ゴリラに対する立ち位置、そしてAIの将来にとって非常に重要な理由をすべて説明する。
しかし、始める前に、まだ「いいね」ボタンを押してチャンネル登録していない場合は、必ず押してください。
さて、まずToolLLMとは何でしょうか?
実世界のRESTful APIで動作することに長けたAIモデルだ。
つまり、APIを通じて互いに会話する多くのオンラインサービスやツールと接続することができる。
例えば、Google Mapsに道を尋ねたり、Spotifyに曲の再生を指示したり、Twitterに何かを投稿したりすることができる。
つまり、ToolLLMにタスクを依頼すれば、どのAPIを使えばそれが実行されるかを知っているのだ。
なぜこんなことがわかるのか?
その秘密はデータにある。
ToolLLMは、Tool Benchと呼ばれる、16,000以上のAPIに関する情報を持つ巨大なデータセットから学びました。
このデータセットは、Meta、Microsoft、Stanford、UC Berkeleyの専門家によって作られた。
彼らはToolLLMに共同で取り組み、2023年8月に論文でその成果を発表した。
ToolLLMの目標は、AIモデルが実世界のさまざまなAPIをうまく使えるようにすることだ。
これは、単純な言語命令とTool Benchデータセットからの適切なAPIコールを組み合わせた特別なデータセットを使用することで実現する。
Tool Benchは単なるAPIセットではなく、各APIに対する指示や解決策も含まれている。
チームはChatGPTを使って、そのガイドラインと例から各APIに対する明確な指示を書いた。
そして、これらのAPIの使い方を段階的に示してもらった。
これらのステップはDFSDTと呼ばれる決定木として表示され、ToolLLMがAPIの最適な使い方を見つけ出すのに役立ちます。
つまり、ToolLLMに平易な言葉で何かを尋ねると、Tool Benchのデータから適切なAPIを探し出す。
そして、DFSDTを使用して、質問された内容に最適なAPIアクションを選択します。
その後、そのアクションを実行し、あなたが理解できる方法で、あるいはあなたが望むフォーマットで結果を出します。
感動的ですね。
しかし、それは最良の部分ですらありません。
ToolLLMは知っているAPIを使えるだけでなく、新しいAPIを学習することもできる。
見たことのないAPIを見せれば、そのガイドラインや例を見て使い方を学ぶことができます。
つまり、ToolLLMは、次々と出てくる新しいウェブツールやサービスに対応できるのです。
さて、ではToolLLMはgorillaにどう対抗するのか?
それを分解してみよう。
ゴリラAIモデルは、カリフォルニア大学バークレー校とマイクロソフト・リサーチによって2023年6月に作られた大規模な言語モデルだ。
GitHubで無料公開されている。
このモデルは、通常の言語指示を与えるとAPIコールを作成することができる。
3つの主要な機械学習ソースからのデータに基づいている: Torch Hub、TensorFlow Hub、Hugging Face Hubだ。
これらのソースは、コンピュータ・ビジョン、音声認識などのトピックをカバーする多くのAPIを持っている。
Gorilla AIモデルが登場したとき、それは大きな話題になった。
APIの呼び出しにおいてGPT-4やクロードよりも優れていた。
加えて、最新のAPIドキュメントをすぐに調べることができたので、ミスを減らし、APIのアップデートに適応するのに役立った。
しかし、ToolLLMはGorilla AIモデルよりも明らかに優れている点がいくつかある。この2つのモデルがどれだけ違うかをよりよく理解してもらうために、簡単な方法で説明しようと思う。
まず、サイズとこれらのモデルが学んだことについて話すとき、ToolLLMは大きな兄弟のようなものだ。
ゴリラAIモデルを、約1700冊の本を読んだ生徒と想像してみてください。
かなり印象的でしょう?
しかし、ここに登場するToolLLMは、16,000冊を超える膨大なライブラリーに目を通している。
だから当然、ToolLLMはより広い理解を持ち、より複雑な課題に取り組むことができる。
さて、あなたが毎日チャットする様々なトピックについて考えてみよう。
ゴリラAIモデルは機械学習の天才ではあるが、好きなテーマから抜け出せないようなところがある。
一方、ToolLLMは、あらゆることについて少し知っている友達です。
ソーシャルメディアのトレンドであれ、最新の大ヒット映画であれ、学校で起きていることであれ、節約術であれ、健康アドバイスであれ。
そして、もうひとつクールなことがある。
オンライン上の物事がいかに変化し、更新され続けているかご存知だろうか?
ゴリラのAIモデルは、これらの変化に関する最新情報を取得するための特別なシステムに依存しています。
常に最新の教科書を参照しなければならないようなものだ。
しかし、ToolLLMは学習が早い。
新しいガイドやいくつかの例を与えれば、すぐに使えるようになり、刻々と変化するオンラインの世界により機敏に対応できるようになります。
このように、ToolLLMは、サイズ、範囲、機能性において、Gorilla AIモデルに明らかに勝っている。
ゴリラの10倍の大きさで、他のモデルにはできないことができる。
ですから、これは間違いなくAIの未来であり、ToolLLMは教育、ヘルスケア、エンターテインメント、金融など、多くの分野でも活躍すると確信しています。
さらに、オープンソースなので、ToolLLMに取り組んでいる人たちのコミュニティに参加することで、ToolLLMをより良いものにする手助けをすることができる。
ToolLLMはGitHubにあり、コード、論文、データセットなどが公開されている。
このAIモデルを使いたいなら、方法はたくさんある。
例えば、ChatGPTや、ToolLLMを使って話を聞いたり話したりするバーチャルアシスタントのLauraと一緒に使うことができる。
また、ToolLLMにコマンドを入力したり発言したりできるウェブインターフェイスもあります。
また、もしあなたが開発者であったり、技術的なスキルがあるのであれば、リポジトリをコピーして、あなたのコンピュータ上でモデルを実行することもできます。
以下のプログラムがインストールされていることを確認してください: Python 3.8、PyTorch 1.9、Transformers 4.9、Flask 2.0、Requests 2.26、LTK 3.6、Beautiful Soup 4.9、Gitです。
リポジトリをクローンするには、以下の手順に従います:ターミナルを開き、リポジトリを保存したいディレクトリに移動し、git clone と入力して GitHub からリポジトリの URL を貼り付け、Enter キーを押してローカル・クローンを作成します。
さて、ローカルマシンでモデルを実行するためには、次の手順に従ってください:クローンディレクトリに移動し、python setup.py installと入力して依存関係をインストールし、パッケージをセットアップします。python tool_llm.pyと入力してモデルを起動します。
ToolLLM is ready to use というメッセージが表示されます。
以下に自然言語コマンドやクエリを入力してください。
また、ToolLLMの技術的な詳細や評価結果について知りたい場合は、研究者が発表した研究論文をチェックすることを強くお勧めします。
これは、ToolLLMのアーキテクチャ、データ作成プロセス、モデル拡張ステップ、パフォーマンス指標について説明した、非常によく書かれた包括的な論文です。
さて、このモデルはすでにめちゃくちゃパワフルだが、まだ成長の余地がある。
ツール・ベンチのデータセットをもっと掘り下げる必要がある。
今のところ、世の中にあるすべてのAPIを網羅しているわけではない。
ですから、さまざまな分野の多様なAPIで充実させることで、さらに汎用性が高まります。
さらに、正確さが最も重要だ。
時にはToolLLMの回答が的確でないこともある。つまり、フィードバックの仕組みを洗練させることは非常に重要なのだ。
もう一つの興味深い点は、ToolLLMがどのように考えているかを理解するために、レイヤーを剥がすことである。
このモデルの意思決定プロセスは謎に包まれたままであり、その内部構造に光を当てることは信頼構築に役立つだろう。
最後に、私たちは大局を無視することはできない。
多くの業界に革命を起こす可能性を秘めたこのモデルの長所と短所を吟味し、責任ある未来のために、その利用が我々の価値観と倫理観に合致していることを確認しなければならない。
このビデオを楽しんでいただけたなら幸いです。もし楽しんでいただけたなら、ぜひ親指を立てて、AIレボリューションを購読してください。
また、ToolLLMやGorillaについて質問やコメントがあれば、以下にお願いします。
お待ちしています。
そして、あなたに質問があります。
今後数年間、ToolLLMはどのように進化していくと思いますか?
以下のコメント欄であなたの考えや予測を教えてください。
ご視聴ありがとうございました。
また次のビデオでお会いしましょう。