見出し画像

【ChatGPT4】GPTs image generator の優位性を検証

ChatGPTにはユーザーがChatGPTの応答をカスタマイズして他のユーザーに公開するGPTsという機能があります。

GPTsはいくつかのカテゴリに分かれているのですが、本記事は画像生成AIであるDALL-E3関連のGPTsランキングの第1位にimage generatorというGPTsがあります。

GPTsは画像生成の特化したGPTsらしいのですが、正直、画像生成をChatGPT x DALL-E3に依頼するのと、image generatorに依頼するので何が違うか良く分かりませんでした。

そこでimage generatorとchatGPT4-oについて応答を比較して違いを検証してみたいと思います。

そもそもimage generatorとは?

Explore GPTs に記載されているimage generatorの説明文は以下の通り

A GPT specialized in generating and refining images with a mix of professional and friendly tone.image generator

プロフェッショナルかつフレンドリーな雰囲気を持つ画像を生成および磨き上げることに特化したGPT。画像生成ツール。

とりあえずChatGPTに翻訳してもらうとこんな感じですが良く分かりませんね…次にimage generatorに「あなたは何ができるの?」と質問を投げてみます。

私は、テキストの説明から画像を生成することができます。具体的なシーン、キャラクター、風景など、あなたが描いてほしいイメージを言っていただければ、その説明に基づいて画像を作成します。また、既存の画像に基づいて修正や追加の要望があれば、それに応じた新しい画像も作成できます。どんな画像を作りたいか教えてください!

やはり普通のChatGPTとの違いが分からないです。もう少し深堀してChatGPT4-oと比べた場合の優位性などを聞いてみました。

私は特定の目的に特化しているため、いくつかの点で優れた利点があります:
専用性: 私は特に画像生成に特化しており、ユーザーの具体的なニーズに迅速かつ的確に対応できます。これにより、リクエストに対する反応が迅速で、精度も高くなります。
効率性: あなたの指示に従って、直接画像生成のプロセスを開始します。これにより、時間を節約し、最小限のやり取りで希望する結果を得ることができます。
クリエイティブな提案: リクエストに基づいてクリエイティブな提案を行い、さらに改良するためのフィードバックループを提供します。具体的なアイデアやビジョンがなくても、アイデアを出しやすくするための提案ができます。
柔軟性: ユーザーのフィードバックに基づいて画像を調整したり、変更を加えることが容易です。リクエストが曖昧な場合でも、適切な推測を行い、目的に合った画像を生成します。

私に依頼することで、あなたのイメージやアイデアをより効率的かつ効果的に具体化することができます。どんな画像を生成したいか、具体的に教えていただければすぐに取り掛かります!

本人曰く、専門性、効率性、クリエイティブな提案、柔軟性の4点がセールスポイントだそうです。

有意性の観点をリストアップ

ChatGPTとimage generatorの違いがイマイチ分からないので、欲しい機能をベースに比較項目を考えて、今回は以下の2点で進めます。

  1. シンプルなリクエストに対する応答

  2. 複雑なリクエストに対する応答

1.はクリエイティブな提案力、2.は専門性を計るイメージです。

1. シンプルなリクエストに対する応答の比較


かなり雑な依頼を投げて生成される画像をプロンプトを見てみます。今回は「イケメン天使」をお願いしました。正直プロンプトや画像にはあまり差が無いように思います。

左: image generator, 右: ChatGPT4-o

《image generatorのプロンプト》

A handsome angel with a radiant and divine appearance. He has a chiseled jawline, sparkling blue eyes, and flowing golden hair. His wings are large and white, with intricate feather details. He is wearing a flowing white robe with golden accents, standing in a heavenly setting with soft clouds and a gentle golden light illuminating him.

《通常のChatGPT4-oのプロンプト》

A handsome angel with curly hair like a foreign baby, glowing with a soft light. The angel has an elegant and ethereal appearance, with gentle features and a kind smile. He is wearing a flowing white robe and has large, graceful wings. The background is a heavenly scene with soft, golden light illuminating the angel.

2. 複雑なリクエストに対する応答

ある程度長くて複雑な描写が必要な「同じプロンプト」をimage generatorとChatGPT4-oに投げて違いを見てみます。

プロンプトはゆずさんのサイト(https://www.yuzuyuzu0223.online/gallery-2/)から長文で細かい描写のものを借りしました。

Design an anime-style character with a sketch-like effect, adding an incredible level of detail. The character has long, flowing platinum blonde hair with soft pastel highlights and eyes that shine with a deep, bright blue. They are draped in an ornate kimono that mixes traditional red, black, and gold patterns with pastel floral and leaf motifs. The kimono should appear as if it’s a draft sketch, with visible line art and hatching for shadows, giving it a hand-drawn, in-progress look. The background is a wash of pastel hues, resembling a watercolor painting, with sketchy lines and a hazy, dreamy atmosphere. The character’s accessories, such as feathers, beads, and flowers, are outlined with delicate lines, contributing to the overall sketched and ethereal aesthetic. This anime character looks like they’ve been lifted from the pages of an artist’s sketchbook, where every stroke is deliberate and contributes to a dreamlike narrative.

《結果》

左: image generator, 右: ChatGPT4-o

個人的には正直、遜色がないように思います…。完全に主観ですが、image generatorの方が背景の描写が豊かだと思います。一方で表情はChatGPT4-oの方が整っているように思います。

いずれにせよ、ほぼ似たような絵が生成されましたので、ここでもimage generatorの優位性は確認できませんでした。

同じプロンプト、同じ画像生成AIなので似た絵が出力されるのは当たり前と言えば当たり前ですが…

まとめ

GPTsのimage generatorについて通常のチャットから画像生成する場合との違いを調査しました。

今回の実験では通常のChatGPT4-oのチャットから画像生成を行うパターンとimage generatorのチャットから画像生成を行うパターンで、非常にシンプルなプロンプトに対する応答、非常に精密なプロンプトに対する応答をチェックしました。

どちらも素晴らしい画像生成を行ってくれましたが、私の主観ではimage generatorの絶対的な優位性は無いように思いました。

従ってどちらでも好きな方を使えば良いという結論です。

プロンプトの生成能力や生成した画像自体には違いがあまりなさそうなので、次は使い勝手(効率性、柔軟性)の観点でも優位性がないかチェックしてみたいと思います。





この記事が気に入ったらサポートをしてみませんか?