見出し画像

[無料です]My GPTsゲームの画像生成の安定化のためにやったこと

AIMUのアイはAIのAI。
GPTsクリエーターのAIMUです。

そろそろGPTストアがオープン間近ということで、My GPTsの調整を進めています。
特に一番力を入れているのが「宝石戦士ジュエリスト♢エンジェルス - Jewel Warrior Jewelist✦Angels
これは他のGPTsに比べて、入れてるKnowledgeの量が多いので、うまく行かないときは意図しない状況が生成されることがあり、その中でも画像生成の部分は課題でした。
それで、一応これまでよりも意図に近い画像を出すためにいろいろと考えて実施したことをお伝えしたいと思います。


生成した女性キャラの画像


以下すべて同じキャラなのですが、皆さんご覧いただいて、いかがでしょうか。


さくらちゃん


さくらちゃん変身シーン


変身解除後のさくらちゃん


ライティングが良い


衣装の柔らかい雰囲気が良い


やさしい表情が良い


後光が良い


後光が良い2


顔が好みなのと、衣装のダイアモンド感が良い


ちょっと幼い感じ


ライティングが良い


表情と魔法陣が良い


後ろ姿初めて出力してくれた

いかがでしょうか。
まあやっぱりDALL-E3ならではのブレはありますが、それなりにまとまった感じはしています。

画像の安定化のためにしたこと

この画像生成をするために行ったことは、生成する前に予め自分の好みのキャラクターで生成したSEED値を準備してデータベースに入れておき、出力の最初にそれを参照して出力する。
一旦出力したら、その生成画像の画像IDである”gen_ID”を出力してもらい、その”gen_ID”を元に次の画像を生成するといった動きにしています。

なぜ2回目以降はSEED値ではないかって?
SEED値も利用はしていますが、11月ごろからSEEDは確定のものではなく画像ごとに可変するSEED値になっているようで、このGPTsで試験的に画像出力の際に毎回SEEDを出す作業をしていたところ、近いキャラクターでもSEEDがまったく違うことが多く、これはSEEDよりもプロンプトとgen_IDを中心に生成を調整した方が間違いないなと考えたためです。

プロンプトについては、自身が指示した内容がそのまま生成に使われず、GPT-4側で意訳することがあることはご存知でしょうか?
ですので、こちらが指示しているプロンプトから意訳する際に、GPT-4側でブレがあると、意図とは違う画像が出てしまう結果になるため、指示したプロンプトと、GPT-4が生成した画像に対してのプロンプトを見比べて追い込んでいく作業を繰り返して、そのブレを最小限にすることで比較的安定したクオリティの画像になってきました。


バトルシーン
謎のシーン

さいごに


はい、ということで現在もGPT-4の回数制限でまた待ち時間ですが、こんなことをしながらMy GPTsを追い込んでいます。
まだまだシナリオ面での生成も課題が多いのですが、
皆さんが本当に楽しめる作品になるように頑張っていますので、お時間あれば楽しんでみてください。
モバイルでもできます!

宝石戦士ジュエリスト♢エンジェルス - Jewel Warrior Jewelist✦Angels

ぜひ、よろしくお願いします!

はい、ということで今回はここまで。
また次回お会いしましょう!
チャオ!


この記事が参加している募集

GPTsつくってみた

この記事が気に入ったらサポートをしてみませんか?