見出し画像

オタクなのでAIで画像を生成するとき、プロンプトを書きすぎてしまいます。

つまりどういうこと?

 しらせさんが理想とするような情景を思い浮かべてプロンプトを書くと、あれやこれや追加しすぎてしまってトークン数が膨大になってしまいます。

画像生成AIを知らない人でもわかるように言うと?

 現在の画像生成AIは"基本的には"「言葉から画像を生成する」仕組みなのですが、しらせさんは好きな要素を詰め込みすぎちゃうのでAIに指示する言葉がとってもながーくなってしまう、というお話です。


具体的にはどうなっているの?

 この記事の画像を例にとると、 少女についての説明で「少女が椅子に座っている。ボブカットの銀髪にヘッドドレス、青い目眼鏡、本を手に持っている、白いメイドっぽい服、長袖、白靴下とルームシューズ」
 背景についての説明で「錬金術ラボ、本棚、窓、青い球体、観葉植物、カーペット」。そして、画風や光にについての説明で「暖かなライティング、セピア風、印象派のように、手前にぼかし、美麗に」と長々と100トークン以上も書いてしまうのですね。

何が問題なの?

 しらせさんが認識しているレベルだとトークン数が多いと「一つの言葉あたりの重みが軽くなってしまう」ということが挙げられるでしょうか。
 「あれ、この単語プロンプトに入れたはずだけど反映されていないなー」というようなことがトークン数が増えると体感で多くなる気がします。

どう解決するといいの?

 似たような色調で背景と主役の子を別々に出す。みたいな手数を踏むと良さそうかな? とか思っています。

 特にまとまっていない感じで思ったことをつらつらと書き連ねましたが、ここまで読んでいただいてありがとうございます。
 先日noteに登録したばかりなのですが、思った以上の「♡」をいただけてとてもうれしかったです。ぜひぜひ、今後ともよろしくお願いしますね。

(「はじめまして」の記事に書いた「AIと心暖まる物語をつくる」の方の進捗もこれから載せていきますっ!)


この記事が参加している募集

#AIとやってみた

27,676件

この記事が気に入ったらサポートをしてみませんか?