見出し画像

AIイラストの制作過程で考えたこと

あくまで自分用メモ。

AIイラストに関しての文章です。技術的なことはほとんどないです。自分のやったことのまとめみたいな感じ。

前回の反省を踏まえて、とりあえず、何を生成したいのかを考える。
とにかく簡単に質の高い絵が量産されてしまうので、ネット徘徊のように知らない間に、最初とは全然ちがう場所にたどり着きがち。「なんでこんな髪のピンクの女の子を量産してるんだ・・・」とかよく思う。
なので、とりあえず目標を決めるために、自分が長年かけて集めた二次元画像フォルダを見直して、自分の好きな絵柄を見直すことから始めた。
うすうす思っていたことなのだが、自分は割と油彩のようないわゆる厚めに色を塗ったイラストとか、コントラストの表現をグラデーションではなく、色の面のみで表現しているようなイラストに惹かれるっぽい。
なので、とりあえ目指す方向性としては「アンドリューワイエスが現代の日本に転生!?画力無双で承認欲求満たしまくった件」的な感じ行こうと思った。

さて、方向性は決まったものの、絵柄というか、絵のタッチを表現するのがかなり難航した。そもそも自分の好きな絵柄をうまく表現するための語彙力と、芸術に対する知識が少なすぎて「ちょっと筆のタッチが残ったような油絵」とか「なんかグラデーションじゃなくて、色の領域だけで濃淡を表現するような手法」とかやたら長い説明になるうえ、あとから自分で読んでも「何言ってんだこいつ?」って感じの説明しかできないのである。
なので、困ったときのAI頼みということで、chatGPTさんに登場してもらって、いろいろ聞いたところ、後者についてはセルシェーディングとかトゥーンシェーディングとかいうらしいことがわかった。んじゃ、セルシェーディングの油絵でいいんじゃね?と思って、作った画像が以下

なるほど、確かにセルシェーディングってのは伝わってそう。でも油彩のタッチか?と言われれば、そんな感じでもないわけで。ここから油彩タッチ探しの旅が始まっていく。

そもそも、この時は二次元特化系のモデルは、筆のタッチとか苦手なんじゃないのかなぁとか思ってました。CGをもとに特化してっているので、そんなことできないんじゃないかと。でも水彩のふわっとした絵はよく見るので、油彩のタッチが出ないのはなんでなんだ?と思っていました。
ちょっとまたchatGPTさんに出張ってもらって手伝って貰った。
調整しながら、出てきたのが以下のプロンプト
ーーーーーー
You come across a striking illustration that captures the essence of Japanese manga and anime, with bold lines and clear contrast reminiscent of traditional ink drawings. The image features a 19-year-old woman with black cat ears on her hoodie, her long black hair disheveled and framing her beautiful, calm expression and striking black eyes. Her modern outfit completes the image, making her look both playful and confident. You wonder what world she inhabits and what adventures she might be on


んで、出てきた絵が以下


少なくとも、筆のタッチに関してはほぼ希望した通りのものが出てきた。
すごいなchatGPT。そしてイラストAI側もこんなわけのわからん長ったらしい回りくどい文章でこんなイラストを生成してくれるとは。
そして注目したのは、絵の印象的にもちょっと昔の80~90年代くらいのファンタジー漫画っぽいテイストになっているところ。なにがどうなってこうなったのかさっぱりわからん。二次元特化モデルは例えば「1girl」と入れるだけで、そこそこちゃんとしたイラストを描いてくれるのだが、逆に言うと何らかの影響がないかぎり、わざわざこんなタッチにはならないのだ。chatGPTのプロンプトが僕には説明のつかない影響をイラストAIに与えてるのだ。
もうこうなってくると、AIが中で何を考えてるのかまったくわからない。
少なくとも、この絵の生成に関しては度肝を抜かれることばかりで、マジで少し気味の悪さというか、疎外感というか、そういうものを感じた。

そしてたどり着いた「traditional ink drawings」という単語、翻訳機にぶっこむと「伝統的な水墨画」という答え。実は日本語言う「デジタル絵」「アナログ絵」とうときのアナログは「traditional」と置き換えられることをこの時初めて知った。そしてink paintとは水墨画のことなのだが、chatGPTの解説によれば、「水墨画って入れておけば、筆のタッチが残るし、イラストAIは水墨画であっても必要とあればカラーにしてくれるんすよ」と教えてくれた。なんだこいつは。まぁ、ほんとにあってるかは知らんけど。

というわけで「アンドリューワイエスが現代日本で画力無双」に必要なパーツはすべて手に入れた感じがする。ここからさらに自分なりにプロンプトに手を加えていって、できた画像が以下

どうですか?自分の好きな画風を突き詰めただけあって、僕自身はこのイラストがかなり気に入ってます。ベージュのスカートという指定を無視されたことを忘れるくらいには。(わざわざ日曜日の夜に長ったらしい解説を書きたくなるくらいには)
以下このイラストを作るにあたっての情報です
プロンプト
(Impressive ink painting,brushstroke, Big difference in color tone),detailed eyes, 1girl,
A woman sitting on the platform of a train station, 19 years old, slim, short, unkempt black hair, black-framed glasses, bright and beautiful eyes, black hair, black hoodie, dark beige miniskirt, (waist-high angle:1.3)
Negative prompt: lowres, (worst quality:1.5), (low quality:1.5), normal quality, text, watermark
設定部分
Steps: 30, Sampler: DPM++ 2M Karras, CFG scale: 6, Seed: 2842214149, Size: 512x512, Model hash: 73ffa8a58e, Model: Defmix_Vae, Denoising strength: 0.5, Hires upscale: 1.7, Hires upscaler: Latent

モデルはDefmix-v2.0というモデルにanythig4.0のVAEをくっつけたモデルを使っています。(VAEならどれでも多分大差ないと思われます)Defmix-v2.0というモデルは細かい描写と面の塗りの感じがとても気に入っていて、今回のイラストを制作するのにぴったりだったと思います。
512x512をHiresでアップスケールしてます。これをやらないと、ここまで筆の感じが出しにくいと感じました。(というかHiresで細かい描写を書き加えると絵のタッチを出しやすいというのにもっと早く気が付いていればここまで苦労しなかったような気がします・・・。)

さて、次はどんな妄想を実現しようか・・・。

この記事が気に入ったらサポートをしてみませんか?