見出し画像

Stable Diffusionをお絵描き道具にしたらどうなるか

Stable Diffusionはとんでもなく美しいキャラ絵がいくらでも作れます。ただ「自分が描きたいと思っていた理想の絵」にはそうそうならないなと感じたので、じゃあ絵描き道具としたらどうかというのが記事の趣旨です。
手法としてはAIフォトバッシュペインティングといったところでしょうか?

始めに伝えおくと、この記事に書かれている手法は早晩陳腐化します。というかWaifu Diffusionをはじめすでにいくつかの部分が不要になっています。
ただ新しい技術が出ればさらに理想の絵に近づけるので、全く落胆することなくむしろワクワクしているところです!

こちらの記事で紹介されている新技術などは、だいぶこの手法を拡張してくれそう。

使用機材

  • Windows 10

  • NVIDIA GeForce RTX 2080 SUPER (8GB)

  • Photoshop 2022

  • Clip Studio Paint

筆者のスペック

フロントエンドエンジニア10年python歴なし。絵は描けますが一昨年再開するまで長いことブランクがあり、絵師と呼べるほどの情熱やプライドはないと自認しています。
ボイスロイドのキャラとかが好き。今回の絵は琴葉茜ちゃんのファンアートです。

Stable Diffusionの環境

最初は公式のものをカスタマイズして使っていましたが、途中から出始めた Stable Diffusion Web UI が素晴らしかったので当作ではそちらを主に使用。


制作

構図を決める

今回のコンセプトは「霧に包まれた街で賞金首を追い詰める女性ローグ(琴葉茜ちゃん)」。基本プロンプトを以下のとおりとし、いろいろ試していきます。

基本プロンプト
portrait of a female assassin fights in mist city, battle action, long straight pale pink hair, black leather assassin armor and skirt, fantasy, oil painting, dynamic pose, dynamic perspective, dynamic angle
(霧の街で戦う女性暗殺者のポートレート、バトルアクション、淡いピンクのロングストレートヘア、黒革の暗殺者の鎧とスカート、ファンタジー、油絵、大胆なポーズ、パースペクティブ、アングル)

数百枚を出力し候補を選定

候補が決まったらWEB UIのimg2imgに画像を持っていき大量生成、より理想に近い構図を模索します。

候補を選んだらそれをもとに大量に出力

どれも素晴らしいのですがたいてい気に入らないところが出てきます。この大量の生成物は全てボツにし、最初の候補をペイント修正したりしながら全体的な構図を確定しました。

最終的な構図

細部を錬成していく

構図が決まったら細部を詰めていきます。
まず最初に画像サイズを4倍にしたうえで衣装を切りぬき、衣装に特化したプロンプトで画像を生成します。

別の候補から気に入ったパーツだけ差し替えたりとか

決定した衣装はPhotoshopのスーパーズームで拡大し(WEB UIのExtrasで拡大しても全然いいと思います)、元絵に合成します。

同じ手順で頭部、髪、腕、剣を生成していきペイントで足し引きしてはimg2imgで生成し直し、理想の造形に近づけていきます。

顔の変遷。なお決まるまでの生成数は千枚をゆうに超えている

これはすごく「自分の描きたい理想の顔」に近いぞ!
とテンションMAXになりつつ全体を合成。完成が近づいてきました。

すべての部位を生成し、合成

完成へ

サイズを変えたので背景を生成しなおします。同時に手の形や髪の毛など気になる個所をペイントで直していきます。
で、完成……といいたいところですが拡大するとAI生成画像特有のおおざっぱだったりへんな模様だったりゴミみたいなのとかが気になるので、ここも直していきます。

表情部分は拡大すると粗さが見えるためさらに生成とペイントを繰り返して美しい顔を仕上げる

完成

自分史上最強にかっこよくてかわいい茜ちゃんができた
ご尊顔を拡大しても十分なクオリティ

「自分が描きたい理想の絵」を100点満点として普段描ける絵はだいたい30-40点なのですが、これは80点を超えたなという実感がありました。
ありがとうStable Diffusion。この技術がなかったら生涯生み出せなかった作品です。

これは自分の作品と言えるのか?

というのが大きな議論になっていますよね。
この絵に関しては自分なりに次の制約を課しました。

  • プロンプトにゲーム名は使ってOK(D&D、ファイナルファンタジー、アサシンクリードあたりを借用しました)

  • 作家名は使用しない

  • あくまで「自分の描く理想とする絵」を追求する

そのうえでの主観ですが、自分の絵と言えるかはわからないけど間違いなく自分の作品とは言えるといった感じです。今日もたくさん生まれるだろう技術を糧に、次は90点を超える作品を目指したいですね。

とはいえ、他者がそれを認めるかどうかは別の話です。
Wikipediaの「印象派」にこんな記述がありました。

写真は現実を写し取るための画家のスキルの価値を低下させた。印象派の発展は、写真が突きつけた難題に対する画家たちのリアクションとも考えられる。「本物そっくりのイメージを効率的かつ忠実に生み出す」という点では、肖像画と風景画は不十分だし真実性にも欠けると思われた。
それにもかかわらず、写真のおかげで画家たちは他の芸術的表現手段を追求し始めた。現実を模写することを写真と張り合うのでなく、画家たちは「画像を構想した主観性そのもの、写真に模写した主観性そのものをアートの様式に取り込むよって、彼らが写真よりうまくできる一つのこと」にフォーカスしたのである。印象派は、正確な再現を生み出すのではなく、彼らにそう見える自然を表現することを追求した。これにより画家は「自分の嗜好と良心とに課される暗黙の責務」を担って、彼らの目に移るものを主観的に描くことが可能になった。

https://ja.wikipedia.org/wiki/%E5%8D%B0%E8%B1%A1%E6%B4%BE

状況が今と似ていますね。私も過去の偉人にならい自分の思考と良心とに課される暗黙の責務に従って、創作活動を続けていければなと思う次第です。

過去のファンアート作例

上記作例は4作目にあたります。作例は時系列順にこんな感じでした。

一作目、騎士姿の弦巻マキ。エフェクトでだいぶごまかしている
二作目、琴葉葵。盾のエフェクトを生み出すのに苦労した
三作目、結月ゆかり。この服のデザインは自分の発想じゃ出てこないなと思った


この記事が気に入ったらサポートをしてみませんか?