見出し画像

Midjourneyで個性的な絵を描くための文法

先日、AIで猫に服を着せて遊びました。

https://note.com/lectin/n/n99c92cad8695

この時のプロンプトを使えばだれでもそれっぽい画像がすぐに作れましたが「みんなと同じじゃヤダ!」という人も多いと思います。猫や猫の人形はAIが上手に描いてくれるので誰がお願いをしてもそこそこ同じような絵になります。猫の人形に個性を与える方法を考えてみましょう。


ロボットの時にも試しましたが、「キャラクターの形状は、色と形の指示と素材の名前に大きく影響される」という法則があります。人の顔も人形も動物も同じです。

・人物の属性
・固有名詞
・色の名前
・形の名前
・素材名
・イメージを現わす言葉
・画家・イラストレーター・ファッションデザイナー・建築家の名前
・国名

このような単語によってありがちな「猫の人形」も見た目が変わってきます。

例えばこの絵は「素材名3個」「画家の名前1個」「属性2つ」「主語と動詞を1つずつ」「色の名前」を使っています。

主題の形状を決める要素は次の通りです。絵を描くときはこれらのワードを計画的に足していきます。

・人物の属性:料理の材料
・固有名詞:料理の材料

・色の名前:料理の調味料
・形の名前:料理の調味料
・素材名:料理の調味料
・イメージを現わす言葉:料理の調味料
・画家・イラストレーター・ファッションデザイナー・建築家の名前:料理の調味料
・国名:料理の調味料

この絵は私が「個性的な人形を作りたい」と思ったので人形のカテゴリを加えました。それはある意味材料にあたるかもしれませんがベースそのものかもしれません。

それがこちらです。この種類の人形を可愛いと思うかどうかは人それぞれですがこれは私にとって良いベースです。

人形のジャンルの威力が強すぎて猫の部分が弱くなっていますね。猫以外を作るにはこちらの方が適しています。

これを素体①とします。

そして材料をちょっと変えてみましょう。猫から別の要素に替えてみました。「これは何かな?!」と考えてみてください。

これが素体①+材料①です。

では調味料を加えてみましょう。

これは素体①に対して素材①を加えました。

これを新たなベースにします。素体②と呼ぶことにしましょう。
これに調味料を加えていきます。

これは素体②に対して調味料②を加えました。

これは素体②に対して調味料③を加えました。

これは素体②に対して調味料④を加えました。

これは素体②に対して調味料⑤を加えました。

これは素体②に対して調味料⑥を加えました。

これは素体②に対して調味料⑦を加えました。

この路線は結構かわいいので気に入りました。

これは素体②に対して調味料➇を加えました。

この系統は個性的。でも好みは分かれそうです。そして打率が悪い。かなり調整が必要そうなので後回しにします。

これは素体②に対して調味料⑨を加えました。

これは…。怖いもの見たさでバリエーションを回してみます。

ヤバそうな眼をしたいかにも顔色の悪そうなやつが大量に増殖。これは使いようかな。材料次第なような気がします。ちょっとだけ試してみましょう。

これは素体②に対して調味料⑨を加えたものに、材料②を加えます。

圧の強さは変わらない。

ちょっと凄いの見過ぎて疲れたので味見タイムはこれくらいにして。


「素体②に対して調味料③」に対して「猫」を新たに加えます。素材の名前を加え、それまで使っていた素材名を服にだけ適用させます。するとこんなテイストに。


では悪役キャラ風にしてみましょう。ちゃんと言葉で「悪役キャラ」と入れます。

私は2、4、5の悪役キャラが好きです。

どの素材と調味料を選ぶかは人それぞれですが、組み合わせ次第で絵は変わります。ただ「猫の絵」というと本当に普通の猫の絵しか出てこないのがAIです。シンプルな構文できちんとした絵を描けるようになったら、「個性を絵に持たせる」というやり方でステップアップすることができます。

調味料は1種類の場合もあれば2種類から5種類を混ぜて使うこともあります。混ぜ放題に混ぜてもすべてをAIが採用してくれるとは限りませんが、うまくいけば自分だけの調味料が出来上がります。

それは個性的でとても楽しい絵になるでしょう。




これは猫の絵に限らずロボットでも人の顔でも同じです。

・人物の属性
・固有名詞
・色の名前
・形の名前
・素材名
・イメージを現わす言葉
・画家・イラストレーター・ファッションデザイナー・建築家の名前
・国名

これらの組み合わせで決まります。

そして重要なのが文法です。どの順番で記述すれば効果的なのかは決まっています。

人物を描くときは私はこのような文法を使っています。

[ナンバリング][主題のジャンル][強い動詞、主語。主語の固有名詞。主語の属性。主語の見た目、主語の服装、小物、その種類。弱い動詞+表情の名前。感情の名前(1or2)][色、物質、鉱物。背景][イメージを現わす言葉]+[画風指示、スタイル指示、画像比率]

そして素材の部分は前方、調味料の部分が「画風指示とスタイル指示」の部分に当たります。

例えばイケメンを描くときもこの文法でプロンプトを書きました。

全てを記述しなくても一部分だけでもいいです。ただある程度を指定したほうが個性が出ますし、崩れにくくなります。

MidjourneyでAIアートを始めた人の多くは最初にパブリックなプロンプトを見て勉強すると思うのですがそこに流れてくるプロンプトがどんなに美しい絵であったとしても必ずしも文法的に問題がない絵だとは限りません。順序がグチャグチャでも綺麗な絵もあります。ただそういう絵はちょっと単語を入れ替えるだけで崩壊したりします。

文法がきちんとしていれば単語を入れ替えても破綻した絵にはならず応用が簡単にききます。調味料が正しく反映されるにはまず最初のベースがシンプルでちゃんとしていることが前提条件なので、シンプルさを極めたらこの文法になりました。

この基礎がわかっていればいろんな絵が描けます。

もちろんこれは今のMidjourneyのversion4で使える文法です。これがアップデートされて仕様が変更されたらまた変わります。この文法に気づいたのも数週間前ですが、この記述にしてから表情の細やかさなどを表現することが容易になりました。

AIに限らず機械に対してプログラミングの専用言語などで指示を与えるときは必ず構文というものがあるはずです。AIにもあると思いました。

それはAIアートの場合はSEでもない一般の人が使うものだからこそ思ったよりも簡単な構造になっているはずだと思いました。

それでいろいろテストしていたら、この順序で書いていけばいろいろなものがコントロールできるということに気づいたんです。

「ピアスをして目隠しをズラしたビジュアル系ロックバンドのイケメン」を描こうと思ったら、この順序で順番に言葉を入れていったらいいんです。難しい呪文とかは必要ないんですよ。誰もが知っている簡単な言葉で1つ1つ丁寧に項目を埋めていくだけ。文法がちゃんとしていればAIは迷わず描いてくれます。

しかもこのやり方だったら、割と同じような顔を生成できるんですよ。
顔のジャンルがコントロール可能になる。

「主語の属性」に「オリンピックのスケート選手」と入れると次のような顔が出ます。当然ほかの単語との組み合わせがあってこそなのですが、ベースをきちんと決めておいてイケメンが出るプロンプトの基礎がシンプルでちゃんとしていれば…。

羽生結弦選手じゃなくて宇野昌磨選手っぽいネイサン・チェン選手っぽい人を持ってくるのか、AIよ…。

こういう感じで主語の記述の組み合わせ方次第では、「同じ人」ではないにしろ「同じような感じの顔」が出ます。だからこの文法を使えば「狙った顔が出る」ということです。

調味料が効果的に絵に反映されるかどうかは「単語の順序」つまり文法にかかっています。適当に単語を羅列してもAIはこちらの意図した通りには描いてくれません。

特にMidjourneyは適当な言葉でもそこそこの絵を描いてくれるので、あまり単語の順序は気にしないという人も多いし、もうすでに自分の文法を持っていてうまくいっているという人もいるでしょう。自分に合ったやり方で絵を描くのが一番だと思います。いろんなやり方があっていいです。

アップデートのたびに変更を余儀なくされるあやふやなものですが、

・動詞が通りやすい
・狙った顔を出したい
・破綻が少ない
・少ない回数でアタリが出やすい

誰もがこれを目標にプロンプト研究を進めていると思います。

もう昔のように何百回も回して良い絵を引くガチャの時代を終わらせたい。AIアートはガチャ要素が強くあってはいけない。思ったように描けるようでないと。

私はAIで絵を作るときは百発百中でアタリを出したいんです。

せめて3回以内ね。


この記事が気に入ったらサポートをしてみませんか?