見出し画像

構図に拘る画像生成をするなら

皆さん、画像生成を楽しんでますか??

こんにちは、サイです。

kindleでもFANZAでもワンプロンプトで構図などまったく気にしないで画像生成しているサイなのですが、ちょっと手間をかけた作品を作ったら売れるんじゃないか?という欲が出てしまいました。

Stable Diffusionで画像生成をしているので、プロンプトをgoogle翻訳を駆使して必死に細かく指示しているはずなのですが全然言うことを聞いてくれません💦

ちょっと試しに、「防波堤で釣りをしている20歳の日本人女性」というテーマでどうしても作品が作りたくなったのでgoogle翻訳で

Full body of a 20-year-old Japanese woman fishing on the breakwater

とプロンプトを作成しました。
(全身を入れたいので「full body」も追加した翻訳にしてます)

このプロンプトを

  1. Stable Diffusion

  2. DALL·E 3

  3. Image Creator

の3つの画像生成AIを使って比較してみたいと思います。

Stable Diffusionで生成

釣りしてるようではあるけど・・・

結構ガチャしたのですが、まともな釣り竿が出てきませんでした。
モデルはBrav5なので、女性自体は無問題に生成されています。
しかし、釣りをしているという部分の要である釣り竿に関してはまったく反映されませんでした。

DALL·E 3で生成

サイはChatGPT課金しているので、DALL·E 3で生成を試してみました。
プロンプトはStable Diffusionとまったく同じものを使っています。

完全に指示の通り、防波堤で釣りをしてる女性

生成一枚目に出た画像がこちら。
これ以上は生成する必要もないですよね。
釣り竿の描写はStable Diffusionと比べてみなさいよ💦
バッチリじゃないですか。
ただ、目を閉じてうつむいているので釣りはしてるか不明ですね。
ガチャすれば完璧な画像は出るのは時間の問題かな?という感じ。

DALL·E 3は結構プロンプトに忠実ではありますが、有料になるので誰でもお手軽にというわけにはいきませんね💦

Image Creator from Microsoft Designer

最後に紹介するのが、無料で使えてプロンプトに忠実な画像生成をしてくれるImage Creator from Microsoft Designer(以下、Image Creator)です。

Stable DiffusionとDALL·E 3で使ったプロンプトと同じものを使用します。

Full body of a 20-year-old Japanese woman fishing on the breakwater


有料のDALL·E 3と遜色ない、むしろ指示に忠実

かなりプロンプトに忠実に釣りをしている感じが出ている画像が生成されました。
女の子の容姿もStable DiffusionとDALL·E 3比較して、一番好みでした。

注意事項としては、Image Creatorは無料で使えますが1日の回数制限があり、商用利用は不可となっています。

ということで今回は、構図に拘る画像生成というテーマで

  1. Stable Diffusion

  2. DALL·E 3

  3. Image Creator

をそれぞれ同じプロンプトで生成して比較してみました。

「オイオイ!! Image Creator?って、商用利用不可じゃ写真集に使えないじゃん」となりますが、ちょっと工夫をすると商用利用可能な画像として生成することが可能になります。

詳しくは拡散特典として、お渡ししますので下記ポストを

「フォロー」「引用リポスト」「いいね」「リプに好きな絵文字」
それぞれがわかるスクショを公式LINEに送ってください!


この記事が気に入ったらサポートをしてみませんか?