見出し画像

Midjourneyで人物の顔の造形と表情をコントロールする方法

AIアートで絵を描くときにただ人物を描くだけではつまらない。その人物が抱いている感情を絵で表現したいと思いますよね。その方法実はとても簡単だったんです。

それは感情の名前を組み合わせることによって実現します。理論自体は難しそうに思われがちですがやることはとてもシンプルです!文法に沿って単語を入れていくだけ!


では簡単な例題を使ってみてみましょう。


今日の実験台はこちらの男性です。

photograph,alluring dandy. --ar 3:2

と入力すると出ます。「色気のある男性の写真、横長」ですね。

まず笑顔にしてみましょう。

photograph,alluring dandy.Smile. --ar 3:2

確かに笑ってる。

smileは「表情を現わす動作の1つ」の単語です。これに感情を表す単語を加えていきます。

たとえばSmile.Disappointment+ Cynicism.のように

文法は、表情を現わす弱い動詞.感情を表す単語+感情を表す単語の順です。

こうすると「複雑な表情を表現した笑顔」ができます。

感情を表す単語は2~3個が良いと思います。多すぎると混ざらずにどれかが否認されるので数には適量があるはず。


photograph,alluring dandy.Smile.Joy. --ar 3:2


photograph,alluring dandy.Smile.Sentimentality. --ar 3:2


photograph,alluring dandy.Smile.angry. --ar 3:2

photograph,alluring dandy.Smile.Sadness+Grief+Fear. --ar 3:2


photograph,alluring dandy.Smile.Pensiveness+Apprehension. --ar 3:2


photograph,alluring dandy.Smile.Fear+ Disgust. --ar 3:2


photograph,alluring dandy.Smile.Surprise+ Interest. --ar 3:2

ここからは怒り顔。

photograph,alluring dandy.angry face.Disgust+ Rage+Loathing. --ar 3:2


photograph,alluring dandy.blow up.upset.irritated.Disgust+ Rage+Loathing. --ar 3:2


試しに感情の名前を加えないで画像を生成してみましょう。

photograph,alluring dandy.upset. --ar 3:2

photograph,alluring dandy.irritated. --ar 3:2

photograph,alluring dandy.mad. --ar 3:2

ほら、あんまりちゃんと怒ってる顔になってくれないですよね。
笑うのはみんなが描かせるからそれなりにできるんですが、それ以外の感情を描くのはAIは苦手なんです。

cross、incense、furious、piss off、lose temper、upsetなど「怒り」を表現する英単語はいくつかありますが「動詞」か「形容詞」ですよね。

「形容詞+感情の表現」
「動詞+感情の表現」

このつながり方で少し表情は変わってきます。動詞の方が得意かもしれないですが、「走る」とか「踊る」といった体を大きく動かす強い動詞と一緒に使う場合は調整が必要です。


さて肝心の「感情の表現」の英単語を勉強しましょう。
これはプルチックの感情の輪という心理学の考え方をそのまま流用します。

https://ja.wikipedia.org/wiki/%E6%84%9F%E6%83%85%E3%81%AE%E4%B8%80%E8%A6%A7

これは感情には名前があり、8つの基本的な感情を元に体系づけられているというもの。詳しくは解説ページを参考にしてください。

ここではAIに指示を出すときにどのように使うかを解説します。

基本感情はまず8つ。

喜び (Joy)
信頼 (Trust)
恐れ (Fear)
驚き (Surprise)
悲しみ (Sadness)
嫌悪 (Disgust)
怒り (Anger)
予期 (Anticipation)

この8つです。これには強弱があり、「喜び」という感情は弱くなると「平穏」に、強くなると「恍惚」になるというものです。正反対の感情は「悲しみ 」ですね。

平穏 (Serenity)<喜び (Joy)<恍惚 (Ecstasy) ⇔ 悲しみ (Sadness)
容認 (Acceptance)<信頼 (Trust)<感嘆 (Admiration) ⇔ 嫌悪 (Disgust)
心配 (Apprehension)<恐れ (Fear)<恐怖 (Terror) ⇔ 怒り (Anger)
動揺 (Distraction) <驚き (Surprise)<驚嘆 (Amazement)⇔ 期待 (Anticipation)
憂い (Pensiveness)<悲しみ (Sadness)<悲痛 (Grief) ⇔ 喜び (Joy)
退屈 (Boredom)<嫌悪 (Disgust)<憎悪 (Loathing) ⇔ 信頼 (Trust)
煩さ (Annoyance)怒り (Anger)<激怒 (Rage) ⇔ 恐れ (Fear)
興味 (Interest) 予期 (Anticipation)<警戒 (Vigilance)⇔ 驚き (Surprise)

さらに期待と喜び で楽観という感情になり、期待と信頼で希望という感情になるというように、いくつかの感情は基本的な感情を融合させて出来上がるというのがプルチックの感情の輪のルールです。

AIに表情を指定しても「それっぽい顔」は描いてくれますが、人間の内面をえぐるような表情にはなりません。ですがこの「感情の名前を足す」ということをするだけで複雑な表現が可能になります。




Smile + fun, burst of laughter.


Smile + fun + Serenity


そしてこのプルチックの感情の輪には不思議なことに「色との組み合わせ」で描写が素晴らしくなるというルールもあります。

ですから感情の名前の前に色の名前をいくつか並べると、その色が絵に使用されるだけではなく、「色と感情の名前」の影響で「顔の造形」を左右するのです。

Pale orange, pink.Melancholy.


この影響はとても少ないもので「ガラリ」と変わるものではありませんが、ほかに含める単語の組み合わせ次第でその描写は固定します。

つまり文法が間違っていなければ、

「決まった顔を描ける」ということ。

AIが苦手とする「同じ顔を描けない」という問題点をこれによってクリアしました。

そしてそれにナンバリングをしていくとAIはそれを覚え、色を変えてメイクアップや服装を変更しても顔は同じになります。


ほらね。ウイッグやアイメイクは変わっても鼻と口と顔の輪郭は同じです。

男性でも同じです。


国籍や人種を変えてもやり方は同じです。




そして最も重要なのがここから。


上の女の子の顔と男の子の顔に使った単語に「美しさを現わす英単語」を1つずつ加えてみますよ。色と表情の部分は変えません。

この子はセクシーな感じになる単語を入れてみました。alluringです。

では次は無垢という意味の単語を入れてみましょう。

ほら、ちょっとだけ顔つきが変わった。

ちょっと落ち着いた感じにする単語を入れてみたらまた変わります。高貴という単語を加えました。

美しさを現わす単語とは、優艶や清楚や可憐、艶やか、あどけない、目の保養などと言った単語のことです。無数にありますよね。問題は英語に翻訳したときに案外数がなくなってしまうということ。ですからこれもいくつかを組み合わせて使います。

最初の色男と同じ単語を使っているのですが年齢が低いせいか女性っぽくなりました。


この男の子たちはベースは変えていないのでがらりとは変わりませんが、ちょっと顔が変化したのがわかりますね。


「美しさを現わす単語」は1~5個くらい組み合わせて使ってみると、毎回違う顔が出来上がり、そのフレーズを崩さなければ主語を変えても動詞を変えても必ずこの顔になりました。


つまり「色の持つ意味」よりも「美しさを表現する単語の意味」の方が強いということです。

美しさを現わす単語>色>感情を表す単語

このような力関係が存在し、それが顔の造形と表情をコントロールします。



今度はあえて色が与える影響をチェックしてみましょう。

この男の子の色を変えてみます。ほらまた顔が変わりました。

2色目の色を変更します。微妙に変わりますが1色目の色の影響が強いんですね。顔の造形は色が決めているというだけでなく、どの色の影響がどの色よりも強いというのがあるのだと思います。

色の中でも造形に影響が強い色と弱い色がある。

そしてその色は不思議なことに

「色」と「感情の名前」の意味合いがリンクしています。


AIは色はただの色ではなく多くの情報を含めているんです。
そう、それはまるで季語のような感じ。
言葉には隠された意味が沢山あるんです。
AIは表立っている言葉の意味よりも、裏にある意味の方をよく描きます。

裏にどんな言葉を含んでいるのかは人間には正しくわかりません。AIとのやり取りの中で少しずつそれを読み解いていくしか方法がないのです。

どの色がどんな形状を引き出すのか、調べてみるにはあまりにも膨大で難しそうですが、一緒に使う感情の名前に似合った色を選ぶと簡単に上手くいきます。

そう!それはまさにプルチックの感情の輪の色に近いんですよ。なんてよくできているんでしょうか?!

その色と名前の意味合いが乖離している場合は絵も綺麗に描いてもらえませんがそもそも表情が上手く決まりません。

表情を上手く描こうとして研究したことが「同じ顔を描くこと」につながるなんてなんてラッキーなんだろうかと思いました。

これはAIの文法研究を趣味とする私にとってとても良い発見。



まとめると。


「色、表情の名前、感情の名前、美しさを現わす単語」が、顔を決める


ということです。

自分の求める顔が出るまで単語を入れ替えていけば「うちの子」が作れるんですよ。シリーズもので自分の好きな絵を大量に作ることができます。

この技術はみんなが欲しかったものじゃないですか?



実際には「主語の形容詞の装飾方法」「主語の指定年齢」などでも顔は大人びたり子供っぽくなったりしますが、ベースを決めるのは色とブルチックの感情の輪の単語と美しさを現わす単語の組み合わせです。

あくまでも「組み合わせ」なので「色、表情の名前、感情の名前、美しさを現わす単語」の4つの構造にそれぞれ入れた単語で大きく表現の幅が変わります。

私は52個の感情の名前の組み合わせを作りました。美しさを現わす単語は24個用意して組み替えています。これを組み合わせると膨大になりすぎてもう説明していられない!!!つらすぎ!

なので皆さんで試してみてください。お好きな単語をお好きな色の名前と一緒に書くだけ!

どの顔が出るのかは、入れた単語次第。

気に入った子の顔が出るまで何度もテストを繰り返さなければなりません。これはトライアンドエラー!気合と根性だけの勝負となります。

この文法で思ったような顔が出ないというのであればそれはちょっと試して出なかったから諦めたというだけ!やれば必ず出ます!なぜなら、これで成功している人もうすでに何人もいますからね。

ただし初心者向けではないです。あくまでもこの技術は上級者向け。

めちゃくちゃ頑張らないと思ったような顔は出ません!!!


文法についてはこちらにも詳しく解説しています。文字数多いけど最後まで読んだらわかるようになっています!


それができるようになるとこんな画像も作れます。

まずは、目を開けた画像。

次が目を閉じた画像。

髪型や細かいアクセサリーなどは100%同じものを描くことがAIの技能的に不可能なので完全に同じにしようと思ったら坊主に全裸でノーメイクにしないかぎり難しいですが、同じような顔の子の表情を変えていくことも可能です。


そして記述する感情の名前を「ポジティブなもの」と「ネガティブなもの」を同時にえらんだ場合、組み合わせ次第では顔の左右で表情が変わります。

AIはできるだけ左右対称な顔を描くことができますが、この方法を選ぶと微妙に視線が左右の目で異なってきます。見ているところがちょっと違うというのは人の心の迷いを表現する時などには使えるはずです。

それは目だけでなく鼻息にまで影響し、片側だけ鼻息プハーの表情を作ることも可能です。鼻息を片側からだけ出す技能が役立つ絵がどんなものかちょっと想像つかないですが。



ぜひぜひ、試してみてください!うまくいったら私にも見せてくださいね!


この記事が参加している募集

やってみた

この経験に学べ

この記事が気に入ったらサポートをしてみませんか?