大規模言語モデルがPythonツールを作成し自ら活用するフレームワーク「LATM」

2023年5月30日 15:55

論文：https://doi.org/10.48550/arXiv.2305.17126
GitHub：https://github.com/ctlllll/LLM-ToolMaker

上記でも紹介しました。

研究詳細：

Deep Mind、プリンストン大、スタンフォード大の研究者らにより、大規模言語モデル（LLM）の問題解決能力を向上させるための新たなフレームワーク「LATM」が提案されました。
LLMが自身で再利用可能なツールを作成し、問題解決に活用することを可能にするものです。
ここでのツールはPythonのユーティリティ関数（再利用可能なコードユニット）として実装されます。

このフレームワークは主に2つのフェーズから構成されています。
1つ目は「ツール作成」で、LLMが特定のタスクのためのツールを作成します。
2つ目は「ツール使用」で、作成したツールをLLMが問題解決のために使用します。

このプロセスは自動化され、ツールメーカーとツールユーザーの間のコミュニケーションは内部的に行われるとのこと。

なお、リソースを大量に消費する強力なモデル（GPT-4など）をツールメーカーとして、軽量でコスト効率の良いモデル（GPT-3.5など）をツールユーザーとして使用することで、コスト効率と品質の両方を維持できます。

AIの能力とその活用の幅を広げる新たな可能性が示されましたね。

より良質な記事をお届けするための取材費に使います！