見出し画像

ChatGPT DALL-E 3で、シード値を固定してキャラクターを維持する話

ChatGPTから使えるDALL-E 3は、生成した画像のシード値を教えてくれるというので試してみました。

シード値を教えてもらう

まずは、適当な画像を生成します。

Full-body portrait of Miku wearing a colorful cute costume, smiling and standing upright
アスペクト比1:2の縦長画像

生成された画像がこちら。

この画像のシード値を教えてもらいます。

1の画像のシード値を教えてください。

シード値は2308105477だそうです。

シード値を維持したまま画像を改変してもらう

シード値を維持したまま画像の修正をお願いしてみましょう。

シード値2308105477を維持したまま、女の子を髪をショートカットにしてください。

生成された画像はこちら。

細部のディティールまでは完全再現されていませんが、髪の毛の長さ以外はほとんど同じ画像が生成されました。

口元の表情がそっくりなのがすごいです。

キャラクターを動かしてみる

このキャラクターに動きを加えてみましょう。

シード値2308105477を維持したまま、女の子が学校の廊下で元気いっぱい走っている画像を生成してください。

生成された画像がはこちら。

おー、指示した通りの画像を生成してくれています。

DALL-E 3は、縦長画像を、「横長の画像を90度傾けたもの」と誤認識することがあるので、画像の内容に合わせてアスペクト比を適切にしてもらいます。

画像の内容に応じて、画像のアスペクト比を適切にしてください。

生成された画像はこちら。

いい感じです。

キャラクターの三面図を描いてもらう。

このキャラクターを作画のリファレンスのしたい場合、全身の三面図があると便利です。
DALL-E 3に描いてもらいましょう。

シード値2308105477のキャラクターの三面図を描いてください。

上半身だけになってしまった+三面図じゃ無いですが、ここまで描いてくれたら、作画のリファレンスには十分です。

全身の三面図も描いてもらいましょう。

素晴らしいです。全身像の三面図も作ってください。

三面図にはなっていませんが、おおよそ欲しい画像は得られています。

もう少し明確に指示を出してみます。

シード値958299549を維持したまま、キャラクターの正面、側面、3/4、背面の画像を生成してください。

生成された画像はこちら。

おしいです。
完全な三面図を作るのは難しそうですが、キャラクターデザインのラフ案としては充分なものが出せそうです。

バリエーションを出してもらう

色違いのバリエーションを生成してもらおうと思います。

シード値958299549を維持して、同じ構図、同じキャラクターの色違いバージョンのキャラクターの正面、側面、3/4、背面の画像を複数枚作ってください。暗い色から明るい色まで、たくさんのバリエーションがあるとよいです。

若干デザインが変わっていて、向きごとに色が変わっています。
指示を正しく解釈するのが難しかったようです。

もう一度やってみます

シード値958299549を維持したまま、1枚の画像の中にキャラクターの正面、側面、3/4、背面の4つを含んだ画像を生成してください。
色違いのバリエーションを出力してください。

生成された画像はこちら。

同じ内容で色違いのバリエーションを4つ生成してください

いろいろなキャラクターのバリエーションが出てきてしまいました。

指示を修正して再度試してみます。

シード値958299549を維持したまま、1枚の画像の中にキャラクターの正面、側面、3/4、背面の4つを含んだ画像を生成してください。

寒色系、暖色系、アースカラー、パステルカラーの4つのカラーバリエーションを生成してください。

寒色系、暖色系のカラーバリエーションを持つキャラクターの四面図を2つ生成しました。アースカラーとパステルカラーのバリエーションも要求通りに生成を試みましたが、現在それらの画像は提供できません。申し訳ございません。

これらの画像はご希望に沿っていますか?それとも、さらに変更や要望がありますか?

2つしか画像が生成できませんでした。

再度試してみます

シード値958299549を維持したまま、1枚の画像の中にキャラクターの正面、側面、3/4、背面の4つを含んだ画像を生成してください。

緑を基調にしたカラーリングと、ペールピンクを基調にしたカラーリングの画像を生成してください。

色の指示は通りましたが、服装が変わってしまいました。

同じキャラクターで服装のバリエーションを生成することはできるでしょうか。

シード値2308105477のキャラクターとシード値958299549のキャラクターのビジネスフォーマルスタイルの全身の三面図を生成してください。
シード値2308105477のキャラクターとシード値958299549のキャラクターの休日のカジュアルなストリートスタイルの全身の三面図を生成してください。
シード値2308105477のキャラクターとシード値958299549のキャラクターの豪奢なウェディングドレス姿の全身の正面、側面、背面の画像を生成してください。
シード値2308105477のキャラクターとシード値958299549のキャラクターの鋼鉄のビキニアーマー姿の全身の正面、側面、背面の画像を生成してください。

もはやシード値でキャラクターを維持しているのかどうかわからくなってきていましたが、色々な衣装の画像をすぐに生成してくれるのは便利です。

キャラクターの性格に応じた服装のバリエーションを生成することはできるでしょうか。

シード値2308105477のキャラクターは、優しくて人当たりのいい人物です。
休日のカジュアルなスタイルの全神像を4パターン生成してください。
シード値958299549のキャラクターは勝気で物怖じしない性格の人物です。
休日のカジュアルなスタイルの全神像を4パターン生成してください。

ある程度明示的に指示を出せば、狙った通りの画像が生成できそうです。

ふりかえり

DALL-E 3のメリットは、明示的な指示をプロンプティングではなく自然言語で出せることですが、そうなると自分が何を生成したいのかを言語化できる能力が問題になってきそうです。

引き続き色々な実験をして、実用的な活用方法を探っていきたいと思います。

参考

Xにマンガを投稿しています
# コルクラボマンガ専科 第8期に参加しています。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?