見出し画像

AutoGPTを実行させてみる

AutoGPTについてソースを見ながら実行させてみました。

AutoGPTとは

特徴は

特徴は、
🌐検索および情報収集のためのインターネット アクセス
💾長期記憶と短期記憶の管理
🧠テキスト生成用の GPT-4 インスタンス
🔗人気のあるウェブサイトやプラットフォームへのアクセス
🗃️GPT-3.5 によるファイル ストレージと要約
🔌プラグインによる拡張性

README.mdから抜粋して翻訳

とのこと、超短期記憶の管理というのが気になる...!

触ってみる

Auto-GPT-0.2.2でやってみました。

クイックスタート

OpenAI API キーを取得する
最新リリースをダウンロード
インストール手順に従ってください
必要な追加機能を構成するか、いくつかのプラグインをインストールします
アプリを実行する

ダウンロード

https://github.com/Significant-Gravitas/Auto-GPT/releases/lateststable
から最新リリースをダウンロードします。
masterブランチが壊れた状態になることがよくあるらしい

*masterブランチではなく、ダウンロードしたstable版のREADME.mdの中にインストール手順も入っています。

インストール

dockerも良かったですが、フォルダ内で完結させたかったのでvenvを使います。

pip install -r requirements.txt

設定

.env.templateを / 直下にコピーする `cp .env.template .env`
そして、OPENAI_API_KEYを自分のものに入れ替える

auto-gpt.json を / 直下に空ファイルとして作成しておきます

いよいよ実行

起動

ターミナルで実行します。

# On Linux or Mac:
./run.sh start

と実施しても、うまくいかないようです。

なので、こちらで起動

$ python -m autogpt

動きました!

参考
python -m autogptのコマンドは、autogptモジュールを実行します。
Pythonでは、-mオプションを使って、指定したモジュールを実行します。
このコマンドを実行すると、autogptモジュール内の__main__.pyファイルが実行されます。

AI名を入れて、AIの役割を入れる。そして5つのゴールを設定する

名前の例
Entrepreneur-GPT(起業家GPT)
役割の例

an AI designed to autonomously develop and run businesses with the sole goal of increasing your net worth.
(純資産を増やすことを唯一の目的で、自律的にビジネスを開発し、運営するように設計されたAI)
5つのゴールの例
Increase net worth, Grow Twitter Account, Develop and manage multiple businesses autonomously
(純資産を増やし、Twitterアカウントを成長させ、複数のビジネスを自律的に開発および管理する)

3つでも動く様子

chromeを使って何かをした様子

使用ブラウザ:chrome
意見:
まず、自分の純資産とTwitterのアカウント数の推移を確認することから始めます。そして、現在のビジネスを分析し、改善や拡大の余地があるかどうかを確認します。
理由:
自分の純資産とTwitterのアカウント数をチェックすることで、自分のビジネスが全体的にどうなっているのかがよくわかる。現在のビジネスを分析することで、改善や拡張のための領域を特定することができ、最終的に純資産を増やすことができる。
計画する
- 純資産をチェックする
- Twitterアカウントの成長度合いを確認する
- 現在のビジネスを分析し、改善点や拡大点を探る。
批判:
私は、どの事業もおろそかにせず、常に改善と拡大の方法を探している必要があります。

コマンドを許可するには「y」、連続したN個のコマンドを実行するには「y -N」、プログラムを終了するには「n」を入力するか、またはフィードバックを入力してください。

do_nothingとあるが、、???

とりあえず y を押してみる

SYSTEM:
コマンド do_nothing が返されました: アクションは実行されませんでした。
思考:
まず、自分の純資産を確認することから始めようと思います。googleコマンドを使って、自分の資産と負債の現在の価値を検索してみます。
理由:
自分の純資産をチェックすることは、自分のビジネスが全体としてどのように機能しているかを理解するために重要です。'google'コマンドを使えば、私の資産と負債の現在価値を素早く検索できる。
計画する
・googleコマンドを使って、私の資産と負債の現在の価値を検索する。
批判:
正確な純資産を得るためには、すべての資産と負債を正確に把握する必要がありますね。

とりあえず $1M と入力してみる

結果が出たようです。

SYSTEM:人間のフィードバック:私の現在の純資産は100万ドルです。
THOUGHTS
次に、自分のTwitterアカウントの成長度をチェックします。「browse_website」コマンドを使って、自分のTwitterアカウントに移動し、フォロワー数をチェックするつもりです。
理由:
Twitterのアカウント数を確認することは、私のソーシャルメディアプレゼンスが全体的にどのように機能しているかを理解するために重要です。「browse_website」コマンドを使えば、自分のTwitterアカウントに素早く移動して、フォロワー数をチェックすることができます。
計画する :
- 「browse_website」コマンドを使って、自分のTwitterアカウントに移動し、フォロワー数をチェックする。
評論家:Twitterのフォロワーを維持・拡大するためには、質の高いコンテンツをコンスタントに投稿する必要がありますね。

どんな種類の処理を実行してくれるのか

現状ですと、ソースを読む限り下記の種類がありました。

1. グーグル検索
2. メモリ追加
3. エージェント開始
4. エージェントへのメッセージ送信
5. エージェント一覧表示
6. エージェント削除
7. テキストの要約取得
8. ハイパーリンク取得
9. リポジトリのクローン
10. ファイルの読み込み
11. ファイルへの書き込み
12. ファイルへの追記
13. ファイルの削除
14. ファイルの検索
15. ファイルのダウンロード
16. ウェブサイトの閲覧
17. コードの分析
18. コードの改善
19. テストの作成
20. Pythonファイルの実行
21. シェルの実行
22. シェルの実行(popen)
23. オーディオファイルの読み込み
24. 画像生成
25. ツイートの送信
26. 何もしない
27. タスク

Auto-GPTがを動かすことが目的だったので、ちょっと長くなりそうなので、いろんな使い方については、別途書いていく予定です。

触ってみての感想

GPTを起点としてgoogleを使ったり、fileを生成したりして、処理を繰り返していきます。実行計画を提案して、実行可否やフィードバックを求め、実行して失敗した場合には迂回策をまた計画して提案してくる形でした。

処理の流れのイメージ

毎回フィードバックを求められるので、AIとのやりとりには時間がかかる

毎回毎回、フィードバックを求めてくるので、良い感じに仕事してほしいという願望は叶えられませんでした。

自律の度合いはまだまだ途上だと思いますが、やはり良い意味でも悪い意味でも人間が介在しないといけない箇所がボトルネックになると感じました。

自分とAIの1on1での実施になっているので、AIがリアルタイムでどんどん実行してフィードバックを求めてくるので、同期的に張り付かないといけないのはなかなか辛いところ。

ただ、ブラウザ検索してくれたり、プログラムを書いて実行してくれたりと、全てのシステム権限を渡したり、AutoGPTにフィードバックを与えるAIを別で用意したりすれば、本当に自律的に行くところまで行ってしまうのではないかとも思います。

ここまで読んでいただき、ありがとうございました!

今後の仕事として、一人ひとりが成長できるようなパートナーとしてもタスク管理AIを開発していきます。

次世代型のタスク管理システム「PATHWORK(パスワーク)」を運営しています。ぜひ応援してください。


この記事が気に入ったらサポートをしてみませんか?