DALLE3のgen_idを用いて類似画像を作成:ChatGPT×DALLE3でAI絵本を作成!
以前はseed値を用いて類似画像を生成しました。今回はgen_idを用いて類似画像を生成する方法を述べたいと思います。
AIで小説や絵本を作成する場合、キャラクターの特徴を維持して違うポーズや表情を再現したので、こうしたseed値やgen_idを用いることは重要です。
概念的なことは後回しで、まずはやり方を実践的に述べていこうと思います。
↓PDFからもご覧いただけます
gen_idの出し方
例えば、以下の猫天使の画像の別バージョンを作りたいとします。
その場合、ChatGPTに、画像を指定し、
「gen_idを教えてください」
とプロンプトで指示すれば出してくれます。
そうすると、以下ようにgen_idが出てきます。
上記の画像では、ついでにseed値も聞いています。両方、同時に出せるので、是非、出してみてください。
キャラクターと背景のgen_id
統合した画像の場合、gen_idは、一つの画像に複数あります。この複数のgen_idを組み合わせることで、類似画像の再現性を高めることができると考えます。
例えば、キャラクターのgen_idと風景のgen_idを個別に出す、というものです。そして統合されたgen_idも出します。このように一つの画像にgen_idは複数あります。
言っている意味がわかりにくいかもしれませんので、実際のプロンプト画像をお見せします。
これは、私が、キャラクターの画像プロンプトと風景の画像プロンプトを個別に作って、最後に統合したために、このように三つのgen_idが存在するのです。
例えば、キャラクターの特徴を維持したい場合、キャラクターの画像プロンプトを個別に作り、後から統合するというテクニックを用います。少し面倒ですが、このようにした方が、キャラクターや背景を細部まで描けますし、キャラクターの別バージョンを作りやすいのです。
gen_idの使い方
まずは、裏技を使わずに、通常のgen_idのみで、類似画像生成を行っていこうと思います。
どうでしょうか?
少し服が変わったり、正面を向いたりしていますが、ほぼ同じキャラの雰囲気で朝の風景となっています。
ここで今回の裏技(?)、キャラクターgen_idと背景gen_idを用いて、より類似度の高い別バージョン画像を生成していきます。それが以下です。
最初のオリジナル画像とほぼ同じで、風景が朝に変更された画像が完成しました。もう一度、以下のオリジナル画像と比較してみてください。
もちろん、完全に一致というわけではないのですが、3つのgen_idを使うことで再現度は高くなったように感じます。
gen_idとは?
概念的なことは後回し、ということで、ここからはgen_idの説明を書こうと思います。特に知らなくても使い方には問題ないので、面倒な方は、ここで本ブログを閉じてください。
gen_idとは、"generated identifier"の略で、コンピューターサイエンスの文脈で生成されたオブジェクトやアイテムに一意の識別子を割り当てるために使用されるものを指しています。
識別する名札・ラベルのようなものですかね。
気になるのは、seedとの違いです。
seed値とgen_idの違い
gen_idは識別IDでした。
seedは乱数に関係し、ランダム性を制御します。そうすることで類似画像を生成します。
seed値は乱数に関わるため、こちらの方がランダム性が発生し、意外なよい画像が生成されるのではないかと思われます。ですから、ある類似性を維持しつつ、クリエイティブに使用したい場合はseedがよいと思われます。しかし、絵本や小説のイラストのように、類似画像の別バージョンを生成する場合には、gen_idの方が再現性が高いので、gen_idを用いた方がよいと考えられます。
それと、再現性を高めるためにseedとgen_idを併用する、ということも考えましたが、これは「必要ない」とChatGPTは言います。つまり、類似画像の別バージョンを生成する場合、gen_idのみでよいということです。
と言うことで、gen_idもかなり使えるので、試してみてください。
それと、少し面倒ですが、画像のクオリティを上げるために、キャラクター画像と風景画像を別個に生成し、それを統合してみてください。そうして、複数のgen_idで再現性の高い画像を生成してみてください。
それでは、また。
ps.最近書いたDALLE3の記事もよかったらご覧ください。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?