見出し画像

自分用、Midjourney公開プロンプトでkawaii二次元イラスト研究日記①

※②書きました



これはお絵かきAIミッドジャーニーのサブスク加入者向けの記事です。未加入者は読んでもあまり面白くないかもです。

ミッドジャーニーとは何か、プロンプトとは、呪文詠唱のコツみたいなのは全部省きます。
自分が読んだものを貼っとくので参考にしてください。

↑とんでもなく長いスレッドですが初日からリアルタイムで追ってたので苦にならず。日々更新中。試行錯誤が面白いので良ければ追ってみてください。

この2つは必修。教科書みたいなもの。

んでここでは何をするのかと言うと、プライベートモードを使っていない場合MJのサイトで生成した画像と使った呪文が公開され皆で評価していく仕様なのですが(見れるのはたぶん会員限定)、そこからプロンプト検索「anime」などでヒットした好みの画像のプロンプトを読み、使ってみて、効果的なプロンプトの傾向をつかもうというのが目標です。

※英語はわからなくて大丈夫です。私もわかりません。キャプションのプロンプトはGoogle翻訳にでもぶちこんでください。ただカタカナ語で翻訳してくることも多いので「ポートレートって何?」「キービジュアルって何?」ってレベルの人だと、その意味の再検索が必要なのでちょっと難しいかもです。

学ぶは真似ぶを語源とするらしいですし、何事も上級者の模倣から形式を理解して発展させるのが近道。
真似されたくない人は50$プランのプライベート(非公開)モード使ってもろてということで文句はMJ運営へお願いします。


実は簡単な強いワードはもうあって、風景画なら新海誠スタイルとかキャラなら原神FGOとかそのあたりの作者名・作品名を散りばめると一撃なんですが、法的にセーフでも今後色々と議論もありそうだし、何よりそれは「簡単」なので今回はやりません。

特に自分は生成した絵の「使い道」がありません。絵描きでもないし、デザイン職でもないし、本当に何に使う予定もなくお絵かきAIで絵を生成して遊んでます。なのでコスパよく見た目が良いものを仕上げる必要が無いんですね。むしろ手間がかかればかかるほど楽しいと言うか。

というわけで原則、作者名や作品名を入れないプロンプトを目指していきます。できれば会社名も避けたい。さすがに死後だいぶ経ってる人とかは使いますが、画風がkawaiiからずれるので滅多に出番はないと思います。

この記事ではとりあえず漫画やアニメ風の美女・美少女キャラを頑張っていきます。
編集技術はない(できないこたないですが)し、編集したらプロンプト研究の意味ないので画像は全て無編集です。
あと全て--testモードで特筆なければ--ar 9:16なのでそこは省いてます(風景などは16:9)。

プロンプト因数分解は最後にやるのでとりあえずキャプションは読み飛ばして良いと思います。
ではレッツMJ

beautiful female rogue, concept art, portrait, close up, dark dramatic atmosphere, astonishing icy eyes, stunning, cinematic lighting, volumetric lighting, mist, epic composition, intricate details, fantasy, braided hair, 2d artwork, comic style, manga, anime

一発生成。撮影用語、美術用語が多いと強い(学習ノイズになるものが排除されて綺麗になる)のはなんとなくわかってきてました。
リアル系の絵柄はファッション誌とかを学習できるので安定します。写真の人間の顔は崩れてないですからね。

元プロンプトではここに「ジョジョの奇妙な冒険」が入っていましたが、無くても若干ジョジョみ出てるような。
全身(fullbody)指定にしたものがこっち。

一発生成。まあうん。もっとガチャを回せば色々出るかもですが次。


gray-colored long wavy hair anime style female character wearing Oversized white hoodie and denim shorts,perfect face,trending,Request fee some yen,Available for a fee, Composition looking down on us, Pose with hands on waist, Dazzling thighs, beauty of slender female legs, The whole body can be seen, full body, genuine smile, color pencil sketch, color pencil drawing, portrait, long eyelashes, beautiful, Less anime-nose, ennui, colorful, vivid-color, Beautiful hair drawing, gray-hair, silver-hair, A little bit of belly showing, simply background, Weak winds, Key visual, Japanese Anime Concept art, Illustration-outlined, cel-shaded, Composition from shoulder up, low angle, Dynamic pose, concept art, main character, Anime Heroine, detailed face, Warm Color Background, 10000+ bookmarks, moe, manga art, teenager,facial features, digital art, anime heroine, hot beauty, Cover illustrations for light novels,digital painting, beautiful composition,cinematic lighting, sunny days, Beautiful facial lines, crosshatching shading,kawaii girl, 8k, Canon EOS C300 Mark III Digital Cinema Camera, Canon CN-E 20mm T1.5 L F Cinema Prime Lens

長え!!
いや長いて。ふざけんなマジって思いながらプロンプト編集しました。何回か回してもクオリティがいまいちでしたし、もし良いのが出来るとしてもちょっとこれは実用的じゃないですね。

元プロンプトには死ぬほど作品・作者名が散りばめられていた(しかも一箇所まとめてじゃなく全体的に)ので苦労して除去。漏れてたらすいません。原神とブルアカはなぜか2回入ってました。

trending on pixiv(ピクシブ急上昇)とかはセーフのような気もするんですが、まあ一応会社名も除く方向なので今回は除外。そうすると本当に酷いイラストばかりになってしまい、

これはこれで好きだけど

プロやプロっぽいクオリティの画像を呼び出すプロンプトの強さを再認識しました。
ここから最初のようなイラストを出すために苦肉の策で
perfect face(パーフェクトボディと同じで実写系の美女生成に頻出)
trending(ピクシブ抜きでも同様の効果出てくれお祈り)
Request fee some yen,Available for a fee(有償依頼を受けてるクオリティ出てくれお祈り)
を願いながら追加してギリなんとか良さそうなのが出てくれた感じです。

やっぱ長いプロンプトにしたところでノイズの回収が多くなるだけなのでクオリティの高いイラストを出すのは難しい。

もっと見ていきましょう。

blurred oil painting,a portrait of beautiful kawaii anime girl with fantasic wizard dress,perfect face, blond hair colors, soft hair style, A girl against the backlight at dusk,knee shot,detailed face, eyes twincle,hyper angle pose, dynamic angle,wide angle,mini dress and mini skirt ,trending, 8k,HQ,octane render

なんかお腹に謎の手あるし、元々見た画像はもっとハイクオリティで可愛かったんですよ…ヴァイオレット・エヴァーガーデンみたいで…まあ、プロンプトにそう入ってるんで当たり前なんですが。
逆にこれに好きな作品名入れたらそれっぽくなるんじゃないですかね。知らんけど。

固有名詞を抜くとやはり酷かったのでこちらもPerfect faceを追加してます。
ピクシブ急上昇という呪文はクオリティ確保のためにやっぱり必要な気がしてきましたがもう少し頑張ります。


得意なar比も意識したほうが良いかなって思ったのがこれ。

anime, manga, portrait, key visual, symmetrical face, anatomical correct, platina blond long hair, beautiful emerald eyes, a beautiful girl who has long hair, long hair entwined with flowers --ar 9:16

こちらは珍しく元々固有名詞が入っていないプロンプトでハイクオリティな画像でした。
真似てもうん…という感じでしたが、元画像が横長だったのでarを16:9に変えてみるといきなり2連続でこれ。

ふつくしい。なぜなのか。
元々全身を映したいときは縦長比のほうが良いのが生成できていたわけですし、そりゃ得意な比率があるのは当然だと思いますが…なぜこの呪文で横長イラストがいきなり激ウマになるのか不明。
顔以外を描くように指示していないからとか構図がないからとか色々ありそうなので、一応正方形も出しておきます。

うーん、デフォルトの正方形もすごく良い。好きだ。
なんで縦長だけアレなの?と思って再チャレンジ。

急にええやん。
左の娘は眉が両津だし、真ん中はぼやけているし、右はおでこの模様が謎ですが、クリーチャーじゃないだけマシ。

ガチャを繰り返せばいつかそれなりのはできそうですが、正方形や横長のほうが得意そうなプロンプトだなあという考えは変わらない程度でした。構図指定や服の指定があれば良いのかも。
あと左は服が横長の一発目の娘と同じなので、指定なしで被るこれはMidjourneyの手癖なんでしょうね。

このぐらいシンプルなプロンプトのほうが好みではありますが、手癖で眉毛以外ほぼ同じキャラができてしまうというデメリットもありそうです。



animation concept art, clean, Clear reflection, character design portrait, layout like a movie poster, Diagonal camera angle, japanese light novel cover illustration, A Fantasy cute girl with white hair and glasses, nape bob haircut, student suit fashionable girl wearing, Aesthetic Anime Eyes, fantasy, moody dynamic lighting bokeh , extremely detailed, full HD, close up shot, Anime detailed line work style, a detailed painting, detailed portrait, cell shaded, sharp focus

一発生成。線の強さや塗り方は好みなんですがリアル系に寄ってますね。
もう少し非現実的な目の大きさで鼻が無くて栗みたいな口をしてるやつが目標。とはいえこれはこれで方向性を覚えておきたい呪文です。


冒頭で紹介した852話(ハコニワ)さんが例示しているプロンプトも使ってみましょう。

beutiful battle girl, kawaii, dynamic pose,battle dress, in magical war, in Steam punk style, steam punk city,sunny sky, untique gear, beautiful eyes illustrations manga, a girl, card game illustration, full body, highlight, sunlight, frill dress, brown hair, blue sky, feather, wind, wallpaper, hq, a girl, hyper angle pose , comic cover, brown hair, big blue eyes, dynamic angle, anime, game character, full body, popular illustration, low angle, 200mm camera lens, popular illustration,anime detailed line work, legs, wide angle, 8K

う〜ん…鼻が無い萌えイラスト風の顔にはほぼ100%なるので、あとはクオリティという感じですね。さもなくばレタッチの技術を磨くしかない。

現状、この方向性に特化していてもっと得意なお絵かきAIが出てきていますし、MJ自体の進化も著しいので、試行錯誤はしつつも妥協は必要かもしれない。

ちなみにMidjourneyが得意な画風はこういうの。

Character design,steampunk

一発生成。おい。
こんなの見せられるとプロンプトひねる意味を見失いそうになりますが、まあ再現性は低かったので気にしないようにしつつ、MJこういうの得意なんだろうなあと思っておきます。

あと書き出しが2Dイラストレーションなのがいくつか「おっ」と思ったので紹介。

2d illustration, sharp focus, concept art, anime beautiful blonde young girl, beautiful face, symmetry face, gentle smile, kawaii moe, illustration, 15-year-old girl, attractive, blonde double braid --ar 9:16

うーん、まあ、うん、まあ。
シンメトリーにすると顔が崩れないけど証明写真になりがちなのは本当ですね。

あとはやっぱ、顔が濃いんですよね…。もっと引きの構図で顔が主役じゃないイラストにすればいいのかしら。
元イラストに「おっ」と思っても作品名・作者名でアニメ顔作ってることが多くて、抜くと実写寄りになるので難しいです。


と思ってたらすごいのを見つけました。

full body front view, night, kawaii anime girl with asymmetrical dark-blue hair in Rough outfits, Dark circles under the eyes, armpit, revealing outfit, feminine figure , glamorous , hazy detail , sharped anime detailed eyes, ennui , 8k, hq, hazy detail , anime, manga, inking, graffiti art, graphic, neon colors, Calm color palette, neon rainbow pastel color scheme, photorealistic, golden ratio composition,one-color background, well-trained glamorous body,cel shading, symmetrical face, high contrast, perfect lighting, Japanese anime style

これも珍しく元プロンプトに固有名詞なし(見落としだったら申し訳ないです)。
これはすごい。すごくない? 1発目と2発目はホラーだったんですが、以降の4連発がこれなので打率が高いです。

方向性としてはこういうのを目指してたのでほぼ正解に近い。構図も豊富に出ますね。ここから
①何を引くと崩壊するのか
②何を足すとブラッシュアップできるか
③何と何が混ぜるな危険なのか
探していきたいところ。

あとは2人ペアのイラストの出し方も少し知っておきたいので出しときます。

two Egyptian princess,in love together,full body 2 women,beautiful girl, Anime, anime style, cute, beautiful eyes, High Quality, popular illustration, natural light, vivid color, detailed facial features, hyper realistic, manga style, digital art, 4K, HQ

なぜか元は一部だけ+で単語が繋がってたんですが、真似ても2人が出てくる絵が少なかったのでカンマに変更しました。接続というか意味の加算的な用途で使われていたっぽいのですが、区切らない単語は普通にスペースで良いと思います。
+は単語の区切りではなく行の区切りのイメージとか見た気がするんですが、どんな意味があるのかよくわかっていません。正直カンマと違いを感じない。誰か教えて。

肝心の百合プロンプトはin love togetherとか割とド直球でした。AIに変化球投げても受け取ってくれないですしね。

ツイン(双子)、シスターズ(姉妹)とかもアリそうですがコミュニティでは実写系しかヒットしなかったので後で自分で試してみます。

仮まとめ

他にもいくつか見てみましたが、HOTの画像は傾向が似たような感じになってきたので公開プロンプトは煮詰まってきた感じ。

ここまでで思うのが
・萌えイラストにしつつクオリティの担保に固有名詞を使わないのはハードモード
ということ。

プロ絵師を食わせずに顔のクオリティを上げようとすると実写寄りになっちゃいますし、バランスが難しい。
その点、最後のプロンプト(百合じゃないほう)はかなり良かったので、他のプロンプトと悪魔融合させつつ練っていくのを次の日記があればやろうかなと思います。


最後に忘れてはいけないこと(自分用)
お絵かきAIに限らずAIの技術発展は目覚ましく、今のバージョンの扱い方を習熟してもすぐに同じ手法が使えなくなる可能性がある。

しかし、だから研究するのが無意味ということにならない。自分のほうも常にアップデートし続ける、そうでなくとも一度は古いバージョンに触れておくことで知識・経験は未来においてアドバンテージになり得る。

イメージ的には「毎月インフレして環境が変わってしまうカードゲーム」。
組んだデッキ全てがリセットされるようなアップデートが来ても、サービス開始から環境を追ってきた古参プレイヤーは環境の理解速度やプレイングにおいて大きなアドバンテージを持つ。


これをしたくて触っているフシはあります。
遊び以外の意味をつけるならAIへの期待と先行投資って感じですね。

だからプロンプトの暗記は必要ありません。
暗記してる間に環境が変わります。辞書を手元に置いてカンニングすれば良い。

まあその辞書は自分でまとめるんですが、辞書の雛形は集合知でなんとなく作られるのでだいぶ楽。
というわけで参考にした呪文の味付けワードを書き出して自分なりに因数分解して終わりにします。

※記事冒頭の他の人のnoteにあるものと一部被ります。
※解釈については深津さんの記事にある通り、「kawaii」というワードを入れたらAIが「kawaiiとは何か」を考えて(理解して)描くのではなく、「kawaiiと説明文に表記されている画像」を学習済みデータの中から掘り起こして、その画像たちの共通項を抽出するので(厳密には違うかもですが実際にはそういう挙動を取る)、単語そのものの辞書的な意味とは必ずしも一致しません。感覚的には「検索ワードに何と入れたら求めている情報が出るか」というイメージに近い。

それでは最初の呪文から
concept art 万能で定番、クオリティアップ
portrait 人物の定番、写真を参考にするはず
dark dramatic atmosphere 雰囲気。ダークだけでも同じ効果が得られるかも。ダークとシャインは万能の味付け
cinematic lighting 映画光、実写系クオリティアップと万能構図力アップか
volumetric lighting 3Dモデルで光線に体積を持たせて表現する的なやつ。実写系クオリティアップ
intricate details 精密度アップ
2d artwork 二次元化
comic style, manga, anime 二次元化

2つ目の呪文
perfect face モデルやグラビア、美人の芸能人を引っ張ってくるかなと思ったが怪しい
trending 流行りの服とかにもベクトルがブレそう
Request fee some yen,Available for a fee 意図は説明済み。正直意味あったか怪しい
Composition looking down on us 構図の指定は大事だが少し弱い
Dazzling thighs,full body 全身を描いてもらうためのいつもの
color pencil sketch, color pencil drawing 色鉛筆。雰囲気は出てた
Less anime-nose たぶんあまり意味ない。鼻無しアニメ顔をAIは理解しないはず。入れなくても鼻無しで表現される
simply background 主にキャラだけ描いてほしいとき背景を指示で消す
Key visual コンセプトアート同様いつもの
Illustration-outlined, cel-shaded アニメ線。はっきりしたフチを取るようになる
Dynamic pose 棒立ちも全然出るので弱いが、まあ人物の全体像なら何にでも入れとく系のやつ
Anime Heroine 指定がなくても高確率で女性を出してくるが指定があるとより確実
10000+ bookmarks ピクシブや海外のピクシブ的なサイトの上位が検索にヒットする…のか?
digital art, digital painting とりあえず入れといて良さげ
8k, Canon EOS C300 Mark III Digital Cinema Camera, Canon CN-E 20mm T1.5 L F Cinema Prime Lens 画質アップの機材系ワード。実写系じゃなくても精密度アップが期待できたり構図力が上がったりするのでとりあえず入れとく系。キャノンが会社名なことは忘れていた

3つ目の呪文
knee shot モデルやコスプレとかの撮影の構図になることを期待してるっぽいが、普通に絵に膝が出てくる
hyper angle pose ダイナミックポーズ的な
dynamic angle ダイナミックポーズ的なのの画角
wide angle 広角レンズ。撮影用語なので構図の補完、人物のクオリティアップになりそう。たぶん風景にも強い
octane render アンリアルエンジン系。画質アップ

4つ目の呪文
symmetrical face 崩壊していない顔が出やすいが証明写真になりがち。構図やポーズの指定と組み合わせたい
anatomical correct 解剖学的な正しさ。骨格の崩壊を防ぎたいんだろうがAIはそれを理解できないのでanatomicalで何かの要素が引っ張られてくるあるいは無視される気がする

シンプルな呪文だったのでMJが手癖で描く。結果、似たものが割と出てきた。

4つ目の呪文
clean わからない。抜いて再現性が無くなったら嫌なので一応残しておく
Clear reflection 照明を当てれるようになりそう
character design キャラ定番
layout like a movie poster まんま
Aesthetic Anime Eyes AIは人間に目が2つあることを理解していない(真似ているだけ)ため鼻の省略がてら目が潰されがちなので、ちゃんと描いてもらうためのもの
moody dynamic lighting bokeh 撮影系のワード。実写系クオリティアップ
sharp focus 上と同様、ピントを特定のものに合わせる撮影系ワード。実写系クオリティアップ

5つ目の呪文
highlight, sunlight 光はとりあえず入れたほうがいい
comic cover 映画ポスターより二次元系で強いかも
popular illustration クオリティアップ

被りが多いので書き出す内容が少なくなってきました。

6つ目飛ばして7つ目、最後の理想のプロンプト
full body front view 構図指定
night 光や雰囲気を指定
,asymmetrical dark-blue hair in Rough outfits 髪型指定は何かしらあったほうがいいかも
armpit わき。服装指定に近いもの
revealing outfit 服装指定
feminine figure フィギュアポーズおよびクオリティアップ
sharped anime detailed eyes 目の指定大事
graffiti art, graphic 影響不明。仮に抜いて上手くいかないなら大事ということになる
photorealistic 写実的なバランス調整か
golden ratio composition 黄金比。とりあえず入れとけ感
well-trained glamorous body 肉体のクオリティアップ

こんなところでしょうか。
これらを使ってオリジナルプロンプトを練ってみたりワード効果の検証はまた今度です。それではまた。


※好評だったので②書きました。


この記事が気に入ったらサポートをしてみませんか?