この動画では、GPT-4 Visionを使った再帰的な改善ループの方法を紹介しています。ウェブサイトや製品の説明文、ストーリーの改善、YouTubeのトレンド分析など、さまざまな領域でフィードバックに基づき繰り返し最適化が行えます。
公開日:2023年10月19日
※動画を再生してから読むのがオススメです。
今日は、GPT-4 Visionを使用してこれらの再帰的な改善ループを作成している方法を紹介したいと思います。
例えば、背景で見ることができるように、私はGPT-4を使用してウェブサイトのHTMLコードを作成します。
これを実行し、ウェブサイトのスクリーンショットを撮ります。
それをGPT-4 Visionに戻します。
今、持っているコードに基づいて、このウェブサイトを改善しましょう。
私たちは新しいコードを取得します。
もう一度実行して、この長い改善ループを作成します。
製品の説明でもこれを行うことができます。
背景で見ることができるように、私たちは製品を作成しようとしています。
それを再び入力し、それを繰り返します。
だから、これはとても興味深いと思いました。
だから、これまでのやり方を見せましょう。
再帰的な改善ループとは何を意味するかを説明するために、DALL·EとGPTを使用して実際に実行してみるのが最善の方法だと思います。
こんにちは、あなたはプロのアーティストです。
この画像を説明してもらえますか?
だから、Googleで見つけた画像をアップロードします。
ストームトルーパーのヘルメットの鮮やかな説明を探しています。
ここにはこの大きな説明がありますね。
では、ただDALL·Eに行くことができます。
こんにちは、画像の説明をしていただけますか?
では、私たちが得たプロンプトを貼り付けますね。
では、もう一度GPT-4 Visionに戻ることができます。
DALL·Eから得たこの画像を貼り付けますね。
では、この画像を説明してもらえますか?
そして、これによって、それの新しい説明が得られますね。
そして、これは、ループのようなものを作ります。
これを何度も繰り返し入力することができます。
それから、この説明を取り、DALL·Eに戻って、その説明をフィードバックします。
新しい画像が得られ、この画像を開発し続けることができます。
これを10〜15回繰り返してみましたが、かなり面白くなったと思います。
では、この再帰的な改善ループから作成したクリップを見てみましょう。ループです。
では、再帰的な改善ループとは何を意味するかが理解できたと思います。
では、他のより生産的な領域でもこれを実装してみましょう。
だから、私はGPT-4が作成したウェブサイトのスクリーンショットを撮ることにしました。
これは、私の以前のビデオからのウェブサイトです。
ここでは、スクリーンショットとコードが表示されています。
このコードを実行すると、HTMLコードが表示され、ウェブサイトが表示されます。
そして、それらを両方フィードバックして、これについて改善を求めることができます。
提供されたコードとスクリーンショットを考慮に入れると、テーマ内に収まりながらウェブサイトの外観を向上させるためにお勧めの改善点があります。
タイポグラフィ、ナビゲーション、セクションの間隔、フッターのスタイリングがあります。
こちらはあなたのコードの改良版です。
わかりました、良いですね。
私たちはそのコードをコピーし、再度実行し、少し異なるウェブサイトになりました。
それで、これが私たちが最終的に作成したウェブサイトです。
今、それは少し違いますね。
それをスクリーンショットし、それを再度フィードバックし、ここで見てください、改善されました。
私たちはもう一度ループを始めます。
以下はいくつかの提案された改善点です:ナビゲーションバー、ヘッダー画像、テキスト、フッター。
わかりました、素晴らしいです。
ここには改良されたコードのサンプルがあります。
私たちはもう一度それをコピーします。
これはループに入っているのがわかると思いますので、これにどこまでも進むことができます。
ただ覚えておいてください、コードは非常に長くなりますね。
それで、私たちはこれを再度実行しました。私はこれを数回行い、私たちはこのウェブサイトになりました。
言わざるを得ない、それは素晴らしく見えますね。
だから、それは多くのことを改善しました。
私たちは2つ目の画像を追加しました。
ここには、私のマウスパッド上に軌跡が見えますね。
それが追加されました。
それはなかなかいいですね。
ここにはテキストボックスがあります。
それはターミナルのようなものなので、aboutと入力すると、いくつかの指示が表示されます。
私のハッカーチームのウェブサイトへようこそ。
私たちはいくつかの画像、プロジェクト、お問い合わせを得ました。
これは、コンタクトのテーマ、コンタクトサイトのものです。
そして、これにはいくつかのハイライトがあります。
私はそれが素晴らしくなったと思います。
だから、これは、私たちが行った5、6つの異なるループだったと思います。
スクリーンショットを入力し、改善を要求し、前後に進む、というようなことをしました。
とても素敵です。
私はこれに感銘を受けましたし、ウェブサイトのことやUIのことで他にどんな使い方ができるか興味津々です。
だから、それは興味深くなるでしょう。
でも、他にもいくつかやることがあるので、それをチェックしましょう。
次のアイデアは、何かの製品の説明を作成することでした。
最近では、この女の子、テイラー・スウィフトのような人を見かけない日はありません。
彼女はどこにでもいますね。
だから、このスタイルで何かの製品を作ることができるかもしれないと思いました。
私はテイラー・スウィフトのAOSツアーのスタイルで、90年代の女性用シューズを選びました。
私のインスピレーションは、アップロードした画像です。
AOSツアーシューズの詳細な説明を作成します。
では、AOS Tシューズのデザインをしましょう。
ここでは、カスタムの指示がありました。
それをお見せします。
だから、私は、あなたはプロのプロダクトデザイナーですよ、と言ったんです。
ユーザーのIDを取得し、ユーザーが提供した画像を元に視覚的な商品説明を作成するのがあなたのタスクです。
製品の説明は非常に詳細でなければなりません。
まあ、それはまるでシステムのプロンプトでした。
そして、ここでは90年代のAOS T90sシューズの説明が表示されます。
では、いくつかの構造と素材があります。
私たちはカラーパレットを持っています。
私たちはデザイン要素を持っています。
私たちは機能的な特徴を持っています。
スペシャルエディションの特徴です。
わかりませんが、とにかく。
それで、ここに説明をコピーしましたね。
私はDALL·E 3に行きました。
こんにちは、これらの靴の説明に基づいて、白い背景のリアルな画像を作成してもらえますか?
だから、説明を貼り付けて、これを取得しました。
それはとても90年代的でしたね。
では、これを見てください。
しかし、これらは完璧ではないと思うので、少し変更したいです。
だから、私は画像をダウンロードしました。
私はここに戻りました。
私は画像を貼り付けました。
素晴らしいです。
これは最初の草案です。
より多くの色を使用した新しい説明を作成できますか?
ここで何をしているのかわかりませんが、とにかく。
わかりました、新しい説明があります。
それをもう一度コピーして、DALL·Eに戻り、貼り付けたら、これができました。
思わず、わあ、それはかっこいいですね。
だから、私はそれにかなり満足していました。
もうやる必要はないと思います。
とても90年代の雰囲気で、まるでテイラー・スウィフトのAOSツアースタイルです。
ここでのインスピレーションを見てみると、ピンクと青がありますね、そしてこれを見てください。
うん、それはマッチしていると思います。
ここには両側に矢印がありますので、これは機能すると思います。
他の何かで試したことはありませんし、忘れたかもしれません。
私はTシャツを作成しましたので、説明とDALL·Eを使って同じことをしましたが、このTシャツができました。
それで、いくつかのことを変えてみましたが、かなりかっこよくなったと思います。
このAOS Tシャツです。
これはなかなかクールですね。
わかりません。
でも、私はただ他のことを試したかっただけです。
基本的には同じ説明で、ただのTシャツです。
これは素晴らしい使い方ができると思います。
まだわかりません。
もちろん、これについてもっと探求していきます。
とても素敵です。
もう一つやりましょう。
次のアイデアは、このストーリーを作成し、そのストーリーを批評できる役割をいくつか作成することです。
批評のスクリーンショットを撮り、それをフィードバックし、それに基づいてストーリーを改善するかもしれません。
実際にはGPT-4 Visionを使用する必要はありませんが、時間の節約になると思います。
だから、それを試してみたかっただけです。
だから、短いSFストーリーを書いてみましょう、と思いました。
ここではバックグラウンドでシステムのプロンプトが表示されていました。
あまり覚えていません。
まず、このアウトラインを取得し、ここに短いSFストーリーを入れます。
だから、それをただコピーすることができます。
しかし、それをする前に、私は先に進みました。
短編SFストーリーを評価し、改善の提案をするために4つの役割を作成する必要があります。
最高の4つの役割は何ですか?
その後、私たちは次のようなものを手に入れました:物語の分析家、キャラクターの発展の専門家、テーマと世界構築の専門家、言語スタイルの編集者。
わかりました、それでいいです。
それで、私はここで4つの役割を作成しました。これらの役割は私たちのストーリーを批評することができます。
そして、私はこのストーリーを各PEの人に提供しました。だから、ここでもう一度見ることができます。あなたはNUGAN、テーマとワールドビルディングの専門家です。
ここに物語があります、それを批評してください。
では、ストーリーを貼り付けて、ストーリーについてのフィードバックを得ます。
では、私が行ったことは、さまざまな役割からのフィードバックをすべてスクリーンショットしました。
では、gp4 Visionに戻り、すべての批評を貼り付けますね。
だから、何かが遅れているようです。
なぜかわかりません。
ストーリーを改善しようとしましたが、うまくいきませんでした。
何かが起こったので、批評が届いたと言いました。
批評を見て、改善したい点の要約を作成してください。
批評のフィードバックに基づいたストーリーの改善の要約を得ることができます。ここでは、ストーリーを改善するために改善したいリストが表示されます。
素晴らしいです!
では、批評に基づいて改善されたストーリーを書きましょう。
わかりました、良いですね。
ループとルーメンの間で、ここではこの批評に基づいた新しいストーリーがあります。
それを読んだら、正直に言ってかなり改善されたように思います。両方のストーリーを読むとわかります。
だから、これは私たちが使えるものになるかもしれません。
私は100%確信がありません。
ボーナスとして、DALL·E 3を使用してこのストーリーのイラストを作成する方法を紹介したいと思います。
DALL·E 3に移動して、このストーリーに4つのイラストを作成してもらえますか?
まず、4つのキーシーンを作成し、それからイラストを作成します。
そして、ここにストーリーがありますので、ここに私たちのストーリーを貼り付けるだけですね。
4つの異なるシーンを取得し、それらのシーンからいくつかの画像を作成します。
だから、かなりシンプルですが、ここでは一貫性がありませんね。
まだ素晴らしい方法を見つけていません。
ここでは少し異なるアプローチを試みたと思います。
ここでは、イラストはスタイルに合わせ、キャラクターの類似性と69の形式を持つ必要があります。
そうですか?
90年代のレトロコミックスタイルの設定で、Dr. Felicity Warrenの説明を作成する前に、プロンプトの概要を作成します。
そして、私はストーリーを貼り付けました。これは少し良くなりました。なぜなら、これでイラストのプロンプトが表示されるようになったからです。それで、もう少し一貫性を持たせようとしました。
そして、それは改善されていますが、完璧ではありません。
彼女は茶色の髪をしていて、白い髪もあります。
ここでは、スタイリストが一貫していますし、さらに下に進むと、いくつかの画像があります。
これはとてもクールだと思いましたね。
しかし、スタイルは一貫していますが、人物は一貫していません。
そして、突然ここに男性が現れました。
ここで何が起こったのかわかりません。
そして、うん、またしても悪くないです。
なんとなくそれが好きです。
だから、これらの画像をいくつか一緒に置いてみましょう。
ストーリーの10秒を聞いてみましょう、20秒でもいいです。
ループとルーメンの間で、フェリシティ・ウォーレン博士は指先が震えながら宇宙船のモニターを覗き込んだ。
彼女は崩壊する太陽の天体の棺に閉じ込められた、崩れゆく星を研究するための使命を持つ天体物理学者でした。
繰り返すごとに、彼女は苦痛な5分間を再体験しました。
警報が鳴り響き、すでにほつれている神経を刺激しました。
では、今日あなたに見せたかった最後のものは、実際には再帰的な改善ループではありませんが、とてもクールだと思いました。
だから、私はこの奇妙なYouTubeチャンネルを見つけました。それはいつもたくさんのビューを持つビデオを作成しており、宇宙やサムネイル、エイリアンについて非常に劇的なストーリーを持っています。
だから、私はここにたくさんのサムネイルとビデオのタイトルをコピーしました。もちろん、ビューもあります。それについて調査してもらいました。
したがって、YouTubeチャンネルVoyagerからのアップロード画像に基づいて、トレンドを見つけて新しいアイデアをいくつか作成しました。
それで、トレンドを分析します。
タイトルの傾向に基づいて、どのような作品がうまくいくかを見ることができます。
「3分前」「1分前」といったタイトルは、緊急性を感じさせる効果を生み出します。
目を引くサムネイル、宇宙とエイリアンの生命、政府の秘密と陰謀、スティーブン・ホーキング、イーロン・マスク、ニール・デグラス・タイソンなどの有名人の使用、ミステリーと説明できない現象の使用。
わかりました、それはいいですね。
そして、バイラル動画をステップバイステップで作成するためのいくつかのコンポーネントがあります。
では、5つの最もパフォーマンスの良い動画をリクエストし、それらの動画から新しいIDを取得したいです。
それで、私は試してみましたが、あまり良くありませんでした。
だから、同じチャンネルからさらに画像を追加しました。
これが最も閲覧数の多い画像で、再度試してみると、より良くなりました。
私はこれが好きです。月の隠された謎:トップ科学者が衝撃的な発見を明らかにする。
だから、それは非常に劇的です。
これは、私たちが作る予定のビデオのようなものです。
月に関連することは何でも、特にミチオ・カクやNE・タイソンなどのトップ科学者が関与している場合、未解決の謎に深く踏み込んだり、月に関するあまり知られていない事実を探求することは、成功するトピックになり得ます。
では、YouTubeのビデオID3のためのビデオアウトラインに直接移動します。
では、それはかなり良いアウトラインを作成します。
私はそれを読みました。
イントロダクション、歴史的背景、新たな発見の紹介、隠された月の基地での月の探索、月の異常な地震活動、月の水、著名な科学者とのゲストセグメント、結論とクレジット、そして行動を起こすように呼びかけがあります。
では、作成したビデオに対して魅力的なサムネイルの説明を作成し、高いCTRを得るようにしましょう。
それについて、私は説明のようなものを頼んだので、それをコピーして、ここに説明を貼り付けました。そして、私たちはこれらのサムネイルを手に入れました。
では、それらを見てみましょう。
だから、The Moon's Secret、まあ、それほど悪くないですね。
そして、The Moon's Mystery、これが好きです。
でも、これは私のお気に入りだったと思います。
わかりません、おそらくこれですね。
とにかく、それらのうちの1つを取り上げてタイトルを表示し、これがクリックされる可能性があるかどうかを確認しましょう。
実際に見てみると、これを使いたかったのはこれだったと思います。
もう少し作成しましたので、おそらくこれかこれかですね。
とにかく、それをアップして一緒に見てみましょう。
わかりました、実際にこれを選びました。
それはかなりクールだと思いました、「月の隠された謎:トップ科学者が衝撃的な発見を明らかにする」という本です。
うん、サムネイルは問題ありません。
もちろん、これについてはもっと多くの作業をすることができますが、簡単なコンセプトだけです。他のYouTubeチャンネルからインスピレーションを得て、それを自分自身のアイデアに逆輸入する方法をどれくらい速く行えるか、ということです。
この場面は良い使い方の一例だと思いました。
これを試してみるかもしれません。
実際にビデオを作成し、サムネイルを作成し、アップしてみて、それがどのように機能するかを確認する必要があります。
とにかく、それが私の再帰的なループについてでした。
これがgp4ビジョンでできることについて、いくつかの良いアイデアを提供できたらと思います。他のものと組み合わせて使用することができます。
私は他にもアイデアがありますが、それについては今後のビデオでより技術的な内容になります。
しかし、これはGPT-4のウィッシュプロパティの非常に興味深い使用例になると思います。
とにかく、チューニングしてくれてありがとう。
素晴らしい一日を過ごして、次回お会いしましょう。