見出し画像

イメージプロンプトを使って色指定をする方法

今日はAIに色指定を通す方法を解説します!


AIに細かい色指定をすることはまだ技術的に難しく、「白いTシャツ、赤い帽子、黒い手袋をして」と指示を出してもその通りにはならず色とパーツはランダムで現れ人間を困惑させます。

実は人間の子供でも本当に色を正しく理解して判断できるようになるには9歳くらいまでかかると言われています。「あれ?そんなことないよ?うちの子は幼稚園の時には赤青黄色がわかっていたよ?!」と驚かれるかもしれません。簡単な色の名前をいくつか覚えることと脳内で正しくいろいろな色を判別し使いこなせることはまた別なのです。そしてそれには個人差があり、脳科学的にはほとんどの子ができるようになるには9歳くらいまでかかるとされています。

人間でも色よりも難しい事柄を理解して言葉を使いこなせるようになった後に色の理解は完了するので、AIが人間と同じような進化を遂げるのであれば「色の指示が通りにくい」という問題はかなり後になるまで解決しないかもしれません。


でも絵を描くうえで「色の指定」というのはとても大切なものです。テキストプロンプトでの指示が通らないのであれば裏ワザを使うしかありません。


私はあるAIアーティストとこのようなやり取りをしました。これはとても興味深い問題でした。

「緑髪でピンクの鎧のキャラクターを再現したいのですが、虹はいつもピンクの髪の人を生成してくれます」

このめんどくさい色問題。ちょっと解いてみましょう。

まず私は簡単にテキストプロンプトに「緑色の髪の毛」と「ピンク色の鎧」を指定して生成してみました。

ほぼ髪色はピンクで出ます。

とりあえず髪の毛を緑色にするために「Glossy GREEN hair.」というように表記します。これは色の部分を大文字にして、形容詞をつなげることで意味合いの比重をあげています。同時に動詞の部分は「he wears pink armor」というように。3枚目にチラッとそれっぽいのが出ています。

これですね。

この絵に対してペンツールなどでピンク色に無理やり塗ります。

これで参考画像の作成はOKです。本当はもっと細かく塗ったほうがいいのだけど私はスマホで作業をしたのでこれが限界。私の指は不器用なのです。

そしてこれをMidjourneyのイメージプロンプトにかけます。いわゆるi2tと言われている手法です。

方法は、次の通り。

まずはこの参考画像をアップロードします。

PCだったら、テキストエリアの左側のプラスのマークを押すとファイルをアップロードという文字が出るのでこれをクリックしてアップロード。

その後UPした画像のURLをコピーします。スマホの場合は右上の丸い点が3つ並んだマークを押すと画像の共有ができるようになっているのでそこから直接画像のURLを取得します。

この準備ができたら、テキストエリアに次のような文法で記述します。

「参考画像のURL」(半角スペース1個)「その絵を描くための通常のテキストプロンプト」

ディスコ―ド上にアップロードした画像の場合はこんな感じですかね。「https://cdn.discordapp.com/attachments/XXXXXXXXXXX.jpg  XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX」
違う場所のURLでも良いそうですがどのURLがどの画像のURLだったのかわからなくなりがちなので私はディスコード上にアップロードしたものを使っています。

そして出来上がった画像がこちら。

緑が強いですね。この時点で「he wears pink armor.」というように指示をしています。これをちょっと変えてみましょう。「he wears PINK and GOLD armor.」にしてみます。

これでピンク色になりました。

なぜ「ピンクの鎧」を「ピンクと金の鎧」としたかというと理由があります。

そもそも金色が強かったのでネガティブプロンプトに「--no gold armor」と入れたのですが、金色の鎧という単語を消すと鎧を着ませんでした。

ほら、この通り。だからこの鎧はもともとが「金の鎧」でそれに色がついているということです。だったらピンク色の鎧の指示は「ピンクと金の鎧」が正しいはず、と考えてこの記述にしてみました。

抽出した中でこの子が条件をそろえていたのでこれを無変換remixで回していきます。

微妙に変なのが出ますね。沢山回せばきれいなのが出るかもしれませんが今回はテストなのでとりあえず1番目の画像にしましょうか。

これをアップスケールするためにU1ボタンを押して待ちます。
このような画像になりました。

もしかしたら目の色も指定できたかもしれないですね。


今回使った技は次の通り。

①「色と形容詞を含めた名詞」を作って指示する
②色は大文字で記述する
③生成画像に直接色を塗って参考画像を作る
④i2tで清書させ、そこから無変換remixでアタリが出るまで回す

上手く生成するコツは、「塗り絵をするときに丁寧に行う」というただ1点だけです。

テキストプロンプトの内容は、「その絵を描くために必要な文字全部」なので画像を生成したときのもので大丈夫です。特別な文字列を用意する必要などはありません。

同じプロンプトを使ってniji・journeyでイラスト風の画像を作ってみます。ちょっと気持ち悪くなりました。そして条件はそろっていません。

Midjourneyとniji・journeyでできることは違うので同じプロンプトでも同じ絵にはなりません。

MidjourneyにはMidjourney用のプロンプトを、niji・journeyにはniji・journey用のプロンプトを用意するか、作ったプロンプトと相性の良いAIを使い分けるかのどちらかの方法を取らなければなりません。

理論上は「そう大きく変わらない」という人もいると思います。ですが実際にAIを使ってみたら「描写は大きく異なる」と実感するはずです。特に日本語プロンプトや日英プロンプトを使ったときは違いを感じやすいし、niji・journeyはイメージプロンプトがMidjourneyに比べて少し苦手なんじゃないかなと思うようなところがあります。使う人間たちの使い方でそれが変わってきたのかな???

でもまぁとにかく2つのAIは似て非なるものなので、上手に使い分けるべき。

今回はイメージプロンプトが得意なMidjourneyで行いました。テキストプロンプトの改変を頑張ったらniji・journeyでも上手にできるようになるかも。でも時間をコストとして考えたらなおさら楽に短時間でできるほうを私なら選びます!

今回はMidjourney!

その都度どちらが有利か考えて使い分けて時短を目指しましょう!



この記事が気に入ったらサポートをしてみませんか?