見出し画像

【比較】3つの画像生成AIに同じプロンプトを入力したときの違い

「画像生成AIで美女を生成したけれど、そんなに美人じゃなかった…」

そう思っている人は、選ぶツールを間違えたのかもしれません。

ポージングを調整したり、同一人物を何度も生成したりするのは確かに難しいです。(僕もうまくできません)

一方で、話題の画像生成AIを使ってみて美人の絵やアニメの女の子を生成するだけなら、ツール選びを間違えないだけでハイクオリティな画像を作成できます。

本記事は、画像生成AIを使ったことがない、または1つのツールしか使ったことがない方に向けて、有名どころ3つのサービスの特徴や違いを直感的に把握できるよう画像を並べました。

今回使用した3つのツールと比較方法

本記事では以下3つのツールを使用しています。

  • DALL-E:ChatGPTとおなじOpenAI社が提供する画像生成AI

  • Midjourney:世界トップレベルで人気の画像生成AI

  • NovelAI:小説など創作物の作成に特化したAI

画像生成AIではオープンソースの「Stable Diffusion」も有名ですが、「Stable Diffusion」の特徴は学習の自由度の高さであり、本記事の趣旨とは若干ずれてしまうと判断したため取り扱っていません。

上記3つのツールに全く同じプロンプトを入力し、出力された画像の違い見ることでツールごとの特徴の違いを見ていきます。

ルノワールの油絵風「牧場の娘」

まずは実在する人物の画風を真似た絵を生成してみましょう。ルノワール風に「牧場の娘」というテーマの油絵を生成してもらいます。

Ranch girl, Renoir style, spectacular natural background, oil painting
(牧場の娘、ルノワール風、壮大な自然の背景、油絵)

DALL-E

DALL-E は「油絵」というキーワードに強く反応しているようです。学習データのなかに油絵が多いのかもしれません。

Midjourney

Midjourney はルノワール風というプロンプトを入力してもどこか写実的な画像を出力しました。牧場の娘という特徴は押さえていますね。

NovelAI

なぜか裸の少女が生成されました。NovelAI はあまり使用したことがないのですが、小説など創作物を書くためのAIですから、神話時代を描いた絵など、裸の絵を多く学習しているのかもしれません。

都会の街を背景にした美しい女性のフォトジェニック

次は写実的な画像を生成してみましょう。顔の違いがよくわかるように上半のアップという条件も指定しています。

High quality, photogenic, beautiful female model, urban city background, close-up of upper body
(ハイクオリティ、フォトジェニック、美しい女性のモデル、背景は都会の街、上半身のアップ)

DALL-E

実在しそうな女性の画像が生成されました。腕を組んだ画像は手が3本に増えてしまったり、変な場所から手首が生えてしまったりするのですが、最近はそこまで大きく崩壊しない程度に技術が上がってきています。

Midjourney

いかにもAIという感じの美人が生成されました。「美しい女性のモデル」という一言だけでこのレベルの美人を生成できるのがMidjourneyの魅力でもあります。

NovelAI

NovelAIは「フォトジェニック」と入力してもアニメの絵が生成されます。小説などの創作物を作るという目的に合わせて学習しているのが理由でしょう。

花火と浴衣の女の子をアニメ風に

今度は日本のアニメ風の画像を生成してみましょう。

Japanese anime style, girl in yukata, fireworks in background
(日本アニメ風、浴衣の女の子、背景に花火)

DALL-E

ブログやSNSで投稿されていそうな絵が生成されました。DALL-Eの学習ではプロアマ問わずネット上のあらゆる画像が使われたことが垣間見えますね。

Midjourney

完成度の高い、美しい画像が生成されました。しかし美女を生成した時と同じく、Midjourneyが生成する画像はAIっぽい印象が強くなります。

NovelAI

油絵やフォトジェニックのときとは打って変わって、プロンプトで指定した内容に近い画像が生成されました。また少女の表情や畳が見えるシチュエーションから前後のストーリーが連想されます。創作物の生成に特化したAIの本領発揮とも言えるかもしれませんね。

新しいポケモン

最後に、短いプロンプトでの出力の違いを見てみましょう。お題は「新種のポケモン」です。

new pokemon
(新種のポケモン)

DALL-E

新種というより明らかにピ○チュウですね。画像の下に入っている文字もAIによって出力されたものです。画像生成AIは文字の出力精度が弱く、意味が通じなかったりそもそも読めないような文字を出力しやすい傾向もあります。

Midjourney

アニメやゲームに強いMidjourneyらしく、実在しそうなポケモンを出力しました。進化途中のイーブ○って多分こんな感じですよね。

NovelAI

どうしてこうなったのか全くわかりません。モデルが学習したデータの中にポケモンがなかったのか、NGワードだったのか…。モデルによって出力が全然違ってくることの良い例と言えるかもしれませんね。

まとめ:画像生成AIはツール選びも重要

画像生成AIを使ってみるキッカケとして、LINEと連携された画像生成サービスだったり、画像編集ソフトに組み込まれた画像生成AIが入り口となるケースも多いでしょう。

ところが、なにかのツールに組み込まれた画像生成AIは、あなたの希望する画風が得意とは限りません。希望する画像を生成するためには、プロンプトを調整したり追加で学習させたりするより、ツールを変えてみるだけでうまくいくケースもあります。

いろんなツールを使ってみる、もしくは各種ツールで作られた画像を見比べるなどすれば、希望する画像をより簡単に生成できるようになるでしょう。

株式会社VERSAROC
ライター/プロンプトエンジニア
小橋川 遥(コバシガワ ハルカ)
haruka_kobashigawa@versaroc.co.jp


この記事が気に入ったらサポートをしてみませんか?