見出し画像

Midjourneyで初心者が思い通りの絵を描くためのコツ

Midjourneyで遊ぶときに使える小技なんかをnoteに描いているつもりなのですが、「役に立った!わかりやすい!おかげでうまく遊べるようになった!いきなり良い絵が描けた!」と言ってもらえることもある反面、「壊滅的に良い絵が描けない!読んでも全くわからない!」と言われることも多くて、同じ文章を読んでなぜにここまで違いが生まれるのだろうかと悩みました。

うーむ。

Midjourneyは確かに「誰でも言葉で指示を出すだけで簡単に凄い絵が描ける」ものだけれど、「コツを理解していないと全然かけない」ものでもあります。

簡単に描ける…

この言葉に引っかかるものがありますよね。確かに言葉を入力するだけで絵が出来上がるのだからそれは「簡単」ではある。

でも本当に簡単か…?!というとそうではない。
すべてを言葉で表現しなければならないだなんて、むしろ難しくないだろうか。

「描きたいものが描けないし、変な絵ばっかり描かれてしまって全然楽しくない!凄い絵を描いている人は一体どんなプロンプトで描いてるんだ?!真似してやるのに全然そうならない!できる人とできない人は何が違う?!本当に同じAIを使っているんだろうか?!」と、初心者の人は誰もが思うことでしょう。

だって手が3本あったり6本あったり首がなかったりするバラバラ殺人現場みたいな画像を平気で作ってくるAIですからね!脱がして欲しいわけじゃないのに勝手に裸にしてくるくせにちょっと水着を着せようとしただけで「エロ禁止」って苦情いってきたりするんですよ!「芸術だって言えば何でも済むと思ってんなよ!」と言いたくなるようなひどい画像もザクザク大量生産されます。そして一度そうなってしまうとそこからなかなか抜け出せない。

今日はその迷い道から抜け出す方法をまとめてみました。


まず失敗するポイントを洗い出してみましょう。

・初心者に限って長文である
・希望がてんこ盛りになっている
・AIが描けないものをリクエストしている

失敗している人のプロンプトを見るとこの3つに尽きます。

なぜこの条件でうまくいかないのかと言うと、このAIは絵を描くのがうまいくせに、言葉を理解する能力は半人前だからです。


AIの言語理解は子供並み!

AIは幼稚園児くらいの子供と同じくらいの言語理解をしていると思えばわかりやすいはず。簡単な言葉ならわかるけど難しい言い回しはわからないんです。そして大人のように勝手にいい具合に忖度してくれない。

単語ならわかるけど文章になるとわかりにくい
順序良く並んでいたらわかる(何が何に対する指示なのかわからないとこんがらがる)
単語の数が多すぎるとどれかが抜ける
・できないことはできない、描けないものは描けない(NGワードは絶対ダメ
理解できない概念がまだある(右と左とか)
知らないことはできない(例えば葛飾北斎は知っていても尾形光琳は知らないから描けないとか)
・〇〇してという肯定系の指示は理解できるが、〇〇しちゃダメという否定形の指示は理解できない

ほらまるで本当に幼稚園児くらいの子供みたいじゃないですか?

なにもかもきちんとわかりやすく説明してやらないと、うっかり中途半端なことでも言おうものなら変に捻じ曲げて理解してわけのわからないことをし始めるのは子供と一緒ですね。

だからまず「わかりやすさ」を重視した言葉遣いをしてあげるとうまくいくんです。



「描いて欲しい絵がどんなものなのか端的にまとめる」

・2Dの絵なのか、3Dの絵なのか?イラストっぽいのがいいのか?写真みたいなのがいいのか?
・縦長の絵がいいのか?横長の絵がいいのか?
・人物を描きたいのか風景を描きたいのか?
・油絵、線画、点描画、フレスコ画、水彩画、浮世絵、アニメ、漫画などいろいろな画風があるのでそれを決める

つまり「絵のジャンル」を最初に決めます。

これらは絵の内容ではなく、あくまでも絵を構成する要素です。これらはプロンプトの中では後方に来ますがとても重要です。ここがきちんとしていないと絵は描けません。そしてこれらは決まりきった文言が存在するのでそれほど難しくはないです。

そしてそれらが決まってくると徐々に「自分が描きたい絵がどんな絵なのか」がはっきりしてくると思います。

「どんな絵なのか:ジャンル」が決まったら「何を描いてある絵なのか:モチーフ」を決めましょう。

しかも描きたいモチーフを1つの単語だけで表してみてください。


「最優先したいものを決める」

複雑な絵を描こうとするときは難しいですが、これなら「サッカーボールの絵」と一目でわかります。だからプロンプトも簡単です。「サッカーボール」と指示すればいいんです。

でも大抵の絵はこんなにシンプルではありません。いろんな要素が組み合わさって1つの絵になります。

でもAIはまず「何を描けばいいのか」を一番最初に知りたがるんです。

こういう絵を描きたいなら「空」です。なんたって大部分が空ですから。

街も雲もタワーも描かれているけれどまずは「空」です。プロンプトの最初には「空の絵」と描いてそのあとに「東京の街」「雲の種類」「タワー」「朝日」といった単語を並べていきます。そしてその後ろには「アニメ」「新海誠風」「イラストレーション」「横長の比率」と続きます。

でも一番大切なのは「1番描きたいもの」を決めてそれを一番最初に記述することです。

これが「言葉の優先順位を決める」ということ。この優先順位の決め方がうまいひとがAIに絵を描かせるのが上手な人です。

決して凄い呪文をたくさん知っている人が凄い絵を描けるわけではありません。言葉の「優先順位を間違えない人」が「思った通りの絵を描ける人」ですから結果的に「AIを扱うのが上手い人」です。思った通りの絵を描かせられないなら凄い絵だって描けないですから。

ちょっと練習してみましょう。

これは「ビックフット」の絵です。雪かきをしていますがビッグフットで、ゴッホ風の絵です。最初にビックフットが雪かきをしていることを記述してそのあとにゴッホ風(Van Gogh style)という文字を加えます。

Bigfoot shoveling snow, Van Gogh style

画風はこのように有名な画家の名前のあとにstyleとつければそれっぽく描いてもらえますがAIが知らない画家の場合は描けません。

これはビッグフットがキッチンでホットケーキを焼いている絵です。記述の最初は「ビックフット」です。ホットケーキやキッチンがメインではなくビックフットの絵です。だから主語はビックフットです。

Bigfoot baking pancakes in the kitchen, Van Gogh style

記述自体はとても簡単ですよね。描きたいものを最初に、どんなタイプの絵なのかは後ろに描くだけです。

描きたい絵柄の情報 (1晩描きたいものを番最初に、次にそれ以外の絵柄の単語、背景の情報)  + その絵の質を構成する情報(2Dか3Dか、イラストなのか写真なのか?画風の設定、縦横の比率など)という順番を守っていれば大抵の絵は上手く描けます。

これを少しだけ複雑にしてみましょうか。縦長にしてみました。--ar 9:16の部分がそれにあたります。数字を入れ替えると好きな比率にできます。

Bigfoot baking pancakes in the kitchen, Van Gogh style, highly detailed, --ar 9:16 --test
Bigfoot baking pancakes in the kitchen, Van Gogh style, highly detailed, --ar 9:16 --test


これを単純に横向きにしてみましょうか。

Bigfoot baking pancakes in the kitchen, Van Gogh style, highly detailed, --ar 16:9 --test


実写っぽくしてみましょう。

Bigfoot baking pancakes in the kitchen, Van Gogh style, 3D, 8K, octane render, wide angle lens, high detail, sharp focus, cinematic lighting, --ar 16:9 --test

浮世絵っぽくしてみましょう。

Bigfoot baking pancakes in the kitchen, in the style of ukiyo-e,insanely detailed, --ar 9:20 --test


漫画風にしてみたらビックフットがかわいい子になっちゃった。

ではあえて線画。

Bigfoot baking pancakes in the kitchen, black ink line art, vibrant watercolors, --ar 3:4 --test


Bigfoot baking pancakes in the kitchen, black ink line art, vibrant watercolors, --ar 3:4 --test

vibrant watercolorsの部分があまり反映されなかったので粘ってV1押しまくると出てきました。

Bigfoot baking pancakes in the kitchen, black ink line art, vibrant watercolors, --ar 3:4 --test


あえて漫画と浮世絵を混ぜてみましょう。

次は虹色の水彩画。

Bigfoot baking pancakes in the kitchen,Rainbow watercolor, --ar 3:4 --upbeta --test



そしてこちらがレンブラント風。足の行儀が悪いです。


Bigfoot baking pancakes in the kitchen, Rembrandt van Rijn, --ar 3:4 --upbeta --test


あえて普通の油絵。良いキッチンですね。

Bigfoot baking pancakes in the kitchen,oil painting, --ar 3:4 --test

今度は粘土っぽいやつ。

Bigfoot baking hot cakes in the kitchen, pop figurine, --ar 16:9 --testp


こんな感じでほんの少しプロンプトをいじるだけで絵の雰囲気を変えることができます。お気に入りを見つけられたら楽しいですね。


でもこれだけじゃうまくいかないときもあります。

例えばこれは「病院の廊下」の絵です。人影が見えますがそれがメインではありません。あくまでも「廊下の絵」です。でも一番最初に記述したのは「古いポラロイド写真」であることです。

Old Polaroid, hospital hallway at night, shadow of a very small person, dark, scary, 1978 Polaroid

なぜなら私は「ポラロイド写真にうつる病院の廊下にいる幽霊」を描きたかったからです。私は普通の心霊写真ではなくポラロイド写真がよかった。

でもそのまま記述するときれいすぎるただの写真が表示されてしまいました。しかも人影もクッキリとしていて全然幽霊っぽくない。

hospital hallway at night, shadow of a very small person, dark, scary, Old Polaroid

このように「廊下、人影、暗くて怖い、古いポラロイド写真」では全然ゾッとしません。AIは本気で怖い幽霊を描いてくれないんです。

だから「病院の廊下に立っている幽霊」とすると描いてはくれないけれど「ただの人影」なら描いてくれます。でも「人影の絵」という言葉を1番最初に描くと前面に人影が出て怖い絵にはなりません。だから「小さい人影」としなければならなかった。それで古いポラロイド写真であることを念押しして2回記述したり一番最初に書いたりしました。本来なら一番最後に書くべき要素ですが、私はそれを一番に選びました。

これが「優先順位を決める」ということです。

「1番は何か?!」といつも自分に問うのです。

セオリーを崩してでも「最優先するもの」を選び続けるのです。


問題のあるプロンプトの修正方法

試しに問題を抱えたプロンプトを修正してみましょう。

古いポラロイド写真に「幽霊を描いて」とお願いしても頑なに描いてくれなかったAIですが、かわいい絵なら描いてくれます。でもこれかわいさが中途半端ですよね。もっとかわいくしていきましょう。

A kawaii ghost icing cream muffin sticker, Frankenstein, graffiti style, highly detailed, os gemeos style --test

「かわいい幽霊の形をしたアイシングマフィンのステッカー」という言い回しにすると全体に白枠が付きます。Frankensteinのリクエストはスルーされてしまいましたが落書きっぽい感じは採用されました。細かい記述とos gemeos風な絵柄は全く採用されていません。

AIに「幽霊とフランケンシュタインは両立しないでしょ」と思われたらそれ以外の部分もスルーされています。そもそもマフィンなのかステッカーなのか?!という部分も微妙です。こういうプロンプトはとてもAIにとってわかりにくイヤなものです。そして os gemeos styleは決してかわいくない。

試しにos gemeos styleを優先させてみるとこんな感じになりました。

os gemeos style, ghost icing cream muffin, highly detailed, --ar 9:16 --test

http://www.osgemeos.com.br/


AIは230歳の老人とか巨乳の小学生などの「ありえないモノ」や「滅多にないもの」は描きません。だから「リクエストしたのにちゃんと描いてくれなかった」というなら「その組み合わせは非常識である」と評価されたということです。

コンプライアンス的に問題がありそうなものは頑張っても描いてくれません。エロと暴力はAI的にお断りなのでヤクザがらみなものも割と無理です。そういうのを無理にでも描くには裏ワザが必要です。

試しにこのゴチャゴチャしたプロンプトを整理して「単純にかわいいゴーストのカップケーキ」を描きます。

必要なプロンプトはたったこれだけ!

kawaii ghost icing cream muffin , graffiti style, highly detailed, --test

最初のがこれです。ずいぶんスッキリしました。

A kawaii ghost icing cream muffin sticker, Frankenstein, graffiti style, highly detailed, os gemeos style --test

・相反する言葉でリクエストをしていないか?
・AIが得意ではない画風を強要していなかったか?
・無駄な重複はないか?

こういった部分をチェックする癖をつけると良いと思います。


この絵は「ヘラジカちゃんにヒョウ柄の服を着せる」というお題で絵を描かせたときに失敗されたものです。誰がマスクを被せてまでヘラジカをヒョウにしろと言ったのか?!ただ単にLeopard Print Georgette Pleated Dressと入力しただけなのに。

このことでわかるようにAIは「2つの動物」をうまく分けて描いたりできません。男女を一度に描くのも難しいし、「右手」と「左手」も理解していないかも。

うちの子供はよく好きで「鬼のパンツはいいパンツ~♪」と歌っていますが、AIはこの文章を理解できないと思います。鬼のパンツを描くべきなのか、鬼を描くべきなのか迷うでしょう。そしてそれを良いパンツと言われてもいいパンツをどう表現すべきか決めかねると思います。AIに理解できるのは鬼とパンツという単語くらいです。

案の定こんな絵しか描けませんでした。



まだこのAIにはできないことが山ほどあります。できないことはやらせないのが無難です。暖かい目で見守ってあげましょう。今は描けるものだけ描いてくれていれるだけでも十分ですからね。


AIでお絵かきするのが上手い人とは?!

TwitterなどではAIを使って描いた作品を公開している人が大勢います。その中には今まで絵を描くこととは無縁だった人もいます。もちろんみんな見様見真似でやっていて誰もAIで絵を描くための学校に通って習ったりしたわけではありません。

もちろん「抜きんでて凄い絵だな!」と思うようなものを描いているのはプロのイラストレーターさんが多いですが、普通の主婦やサラリーマンも多いです。

プロの絵描きの人が良い絵を描けるのは「芸術について勉強していてその絵がどんな言葉で引き出されるのかを知っている」からです。画家の名前や絵のスタイルに呼び方があることを知らなければプロンプトは作れませんから、当然芸術の基礎を知っている人は有利です。

英語で入力しなければならないから英語が得意な人の方がいいのかと言うとそうでもありません。AIは単語主体で理解しているので翻訳ソフトなどを使って英単語を探して記述すれば問題ないですし、むしろペラペラの人が長文を打つと失敗しがちです。

AIはあくまでも機械なので論理的な思考で指示を出さないといけないです。ですから意外とSEを職業にしている人がAIお絵描きにハマっていることが多いですね。「論理的思考」って言うとちょっとわかりにくいけどさっきカップケーキの絵を修正したときに「つじつまの合わないことはないか」と考えたようなことです。

・考えていることを言葉にする
・筋道が通っているか確認する
・間違った部分を見つけて修正できる
・先を見通してテストしながら未知の答えを見つける
・自分の癖を理解してそれを避けられる

一発で良い絵が描けるとは限らないのでこのあたりのことを気にしながらプロンプトの修正作業をしていくんです。


そして絵を上手に描けないと悩んでいる人は、「未熟なAIに合わせてわかりやすい言葉遣いを心がけながら、出した指示のつじつまが合っているかどうか」を考えないといけないだなんて発想自体がない人が多いです。

「あれも描いて欲しいこれも描いて欲しい」と要求を連ねてばかりいるはずです。「オカシイな~!オカシイな~!!この言い方でもダメなの~?せめてこっちは描いてよ~!」なんて思いながら記述したい単語を増やしているかも。

プロンプトは膨大になっていつの間にか指示の通らない単語だらけになっています。どうしたって初心者には何百個も単語を重ねたプロンプトの方が凄そうに見えちゃうじゃないですか。でもシンプルな構文の威力を感じて欲しいです。だってこのAIはまだ長い文章を理解できるほど賢くないもの。

簡単な言葉を!
記述の順序は先に「描いて欲しいこと」次に「画質の設定」の順!
優先順位を決めて!
つじつまが合っているか確認!

この4つを守れば、大丈夫。

色や構図、ライティングや画家の名前について勉強したりすると描ける絵の幅が広がります。

後は気合と根性!

良い画像が出るまでひたすら生成を繰り返すだけ!この根性がない人にはAIで絵は描けません。一見サラリと描いているような人でも無数のダメ画像を生み出したうえで最高の一枚を見つけているはず。

ひたすら描き続けるんです…。



こんなふうにいろんな絵を描いてくれるので。

この記事が気に入ったらサポートをしてみませんか?