ChatGPTにはユーザーがChatGPTの応答をカスタマイズして他のユーザーに公開するGPTsという機能があります。
GPTsはいくつかのカテゴリに分かれているのですが、本記事は画像生成AIであるDALL-E3関連のGPTsランキングの第1位にimage generatorというGPTsがあります。
GPTsは画像生成の特化したGPTsらしいのですが、正直、画像生成をChatGPT x DALL-E3に依頼するのと、image generatorに依頼するので何が違うか良く分かりませんでした。
そこでimage generatorとchatGPT4-oについて応答を比較して違いを検証してみたいと思います。
そもそもimage generatorとは?
Explore GPTs に記載されているimage generatorの説明文は以下の通り
プロフェッショナルかつフレンドリーな雰囲気を持つ画像を生成および磨き上げることに特化したGPT。画像生成ツール。
とりあえずChatGPTに翻訳してもらうとこんな感じですが良く分かりませんね…次にimage generatorに「あなたは何ができるの?」と質問を投げてみます。
やはり普通のChatGPTとの違いが分からないです。もう少し深堀してChatGPT4-oと比べた場合の優位性などを聞いてみました。
本人曰く、専門性、効率性、クリエイティブな提案、柔軟性の4点がセールスポイントだそうです。
有意性の観点をリストアップ
ChatGPTとimage generatorの違いがイマイチ分からないので、欲しい機能をベースに比較項目を考えて、今回は以下の2点で進めます。
シンプルなリクエストに対する応答
複雑なリクエストに対する応答
1.はクリエイティブな提案力、2.は専門性を計るイメージです。
1. シンプルなリクエストに対する応答の比較
かなり雑な依頼を投げて生成される画像をプロンプトを見てみます。今回は「イケメン天使」をお願いしました。正直プロンプトや画像にはあまり差が無いように思います。
《image generatorのプロンプト》
《通常のChatGPT4-oのプロンプト》
2. 複雑なリクエストに対する応答
ある程度長くて複雑な描写が必要な「同じプロンプト」をimage generatorとChatGPT4-oに投げて違いを見てみます。
プロンプトはゆずさんのサイト(https://www.yuzuyuzu0223.online/gallery-2/)から長文で細かい描写のものを借りしました。
《結果》
個人的には正直、遜色がないように思います…。完全に主観ですが、image generatorの方が背景の描写が豊かだと思います。一方で表情はChatGPT4-oの方が整っているように思います。
いずれにせよ、ほぼ似たような絵が生成されましたので、ここでもimage generatorの優位性は確認できませんでした。
同じプロンプト、同じ画像生成AIなので似た絵が出力されるのは当たり前と言えば当たり前ですが…
まとめ
GPTsのimage generatorについて通常のチャットから画像生成する場合との違いを調査しました。
今回の実験では通常のChatGPT4-oのチャットから画像生成を行うパターンとimage generatorのチャットから画像生成を行うパターンで、非常にシンプルなプロンプトに対する応答、非常に精密なプロンプトに対する応答をチェックしました。
どちらも素晴らしい画像生成を行ってくれましたが、私の主観ではimage generatorの絶対的な優位性は無いように思いました。
従ってどちらでも好きな方を使えば良いという結論です。
プロンプトの生成能力や生成した画像自体には違いがあまりなさそうなので、次は使い勝手(効率性、柔軟性)の観点でも優位性がないかチェックしてみたいと思います。