![見出し画像](https://assets.st-note.com/production/uploads/images/108226111/rectangle_large_type_2_fd73348fae3857e6064c8d63fbf8f0fb.png?width=1200)
なぜ描き込みを増やすのか
・前書き
こんにちは。こんばんは。
水色の焦土です。
前回の記事で完全に書くことがなくなってしまったのですが、とりあえずでも手を動かした方が良いと思い、今回はこのテーマで書いていこうと思います。
自分の内的動機以外の理由であれこれすると良くないとは自覚しつつも、思考整理は積極的にやっていきたいという気持ちとは矛盾しますね。色々と難しさを覚える日々です。
そんなところで、今日もやっていこうと思います。
・なぜ描き込みを増やすのか
ということなんですが、その理由について考えていこうと思います(一般論としてではなく、わたしの欲求であることは先に明言しておきます)。
そもそものスタンスとして、わたしは AI生成物にしても手描きのイラストにしても、描き込みが多いものが好きです。ピクセル数的な意味でもそうですが、画面内の情報量的にも解像度が高いものが好きです。
情報量というのはあればあるだけ“強い”ものなので、削ぎ落とす美学ももちろんありますが、人間というのは何にせよ本能的に“強さ”に傅く生き物ですので(オタク特有のデカい主語)、そのような理由でわたしは描き込みが多いイラストが好きです。
何より、情報量を落として作品としてまとめ上げるのは、わたしたちが思っている以上にセンスと実力を伴う技術の結晶なので、AI生成物との相性も悪いと思っております。イラスト生成 AIの、何となくのコンセプト以上のコントロールが利かない取り回しの悪さは、ここ最近特に実感することです(敢えて言及するなら、niji・journey はその要求を叶えやすい生成サービスかとは思いますが、コントロールを利かせた結果そうなっているわけではないとも思っておりますので、別段どの生成サービスもそう変わらないような気もしています)。
というわけで、AI生成物の進化が情報量で圧倒する方向に向かっている/向かったのは必然かと思います。SDにそういったモデルが出てきた時点で、あるいは既存のイラストレーターとの差別化(あるいは臨戦態勢)を整えるためにも、個人的にはそうならざるを得なかった印象があります(結果論かもしれません)。
情報量、と一言に言っても色々ありますよね。
描写物を増やすのか、描写物の細部に働きかけるのか。
デザインを囓ったことがあるのか(わたしはデザインを勉強したことはありません)、画面内の情報量や視線誘導について考えたことがあるのか、という点で、どういうアプローチが成されるのか分岐する印象です。
ですが、別にイラストにせよ生成物にせよ、必ずしもデザイン的に優れていれば良い、デザイン的に優れているものだけが目に付く、デザイン的に優れているものだけが支持される、というわけでもありませんので(表現者として、何を最優先に表現したいのか、という大前提がありますので)、特に試行回数がものをいう AIイラスト生成においては、大衆的な評価を望まなければ、あるいはそういった表現も良いのではないかとわたしは思います。
![](https://assets.st-note.com/img/1686716053844-hOwVdWy9dw.png?width=1200)
![](https://assets.st-note.com/img/1686716104882-WWcYJVvgKh.png?width=1200)
(とはいえ、こういった画面構成というのはやはり見づらいものです。キャラと背景が同色かつ、全ての描き込みが均一になっているので何を見たら良いかわかりませんね。「その2」に至っては手前下に描かれた謎の青緑色の液体とその左側にある鍋のような物体が主役になっています)(「その2」は確か「steam punk」とプロンプト指定したはずですが、歯車メインの衣装をキャラに着せてきた時点で以降「steam punk」を指定しなくなった覚えがあります。なぜならこれは「gear punk」だからです)
![](https://assets.st-note.com/img/1686716760983-GNyIsHHgvc.png?width=1200)
(わたしの感覚ですと、これくらいでギリギリかなぁという気がします)
![](https://assets.st-note.com/img/1686716920394-uwZin9qF9R.png?width=1200)
(これは色指定に気を遣った生成物ですが、まぁ見づらいですねぇ……)
前述した通り、見やすいだとか見づらいだとか、そういった客観的(という名の主観的)な感覚というのは評価を得たい発表物において特別重視したい項目なのであって(それも評価の前提になるとは限らない。それを気にしているものが「評価されやすい」というだけのような話に思える)、理想の表現や表現方法にこだわりたいのであれば、別段気にする必要は無いとわたしは思います。
とはいえ、そもそもインターネットにそれらを発表しているのならば、少なからず評価なり同意なりを得たいものだとは思います。わたしもそうです。良いと思ったものを良いと言ってもらいたいと思う気持ちは、決して不健全なものではありません。
わたしは、描き込みが多いイラストが好きです。
描き込みが多ければ多いほど好きです。それは普段わたしが投稿している生成物を見て頂ければわかることかとは思います。
特に、無機物においては描き込みが多ければ多いほど良いと思っております。
![](https://assets.st-note.com/img/1686719265328-4uSiNDadFG.png?width=1200)
![](https://assets.st-note.com/img/1686719415107-efjyfufF9s.png?width=1200)
これは背景プロンプト群と『flatBG』をそれぞれ2.0まで効かせて『2M SDE』を使用した生成物ですが、正直やり過ぎ感はありますし、わたしの求める描き込みの細かさとの宗教観の違いはあるものの、それでもあまり悪くはないなと思っております。『flatBG』は人物への影響が少ないのも良いですね。キャラの全身が画面内に収まるくらいの構図なら、ほぼほぼ余計な影響も受けずにLoRA無しと同程度のキャラ描写に専念してくれるのが好きです。
『flat2』は使用したことがありません。強めにマイナス作用させると画面全体が黒ずんでしまうのが惜しいなと思います(人物に強い作用が働いてしまうと、途端にメリハリの無い画面作りになってしまう)。『flatBG』でも服飾への影響はあるので、髪の描写に影響を与えたくないのなら『flatBG』が選ばれるのかなと思っております。
![](https://assets.st-note.com/img/1686722948532-UfbXwxPzYP.png?width=1200)
![](https://assets.st-note.com/img/1686722982920-udVJbjdahs.jpg?width=1200)
こちらは『2M v2』の使用例。
正直『2M SDE』より好き。色彩のメリハリがもう少し付けば良いなと思っているのですが、なら素直に『2M』を使えば良いのか……? そしてその4は明らかにやり過ぎ感。
![](https://assets.st-note.com/img/1686726687428-JPaq8C5Bw2.png?width=1200)
![](https://assets.st-note.com/img/1686726750923-EXdYRIMYN2.png?width=1200)
『2M』使用例。もうこれで良い気がしてきた例。
というような感じで、背景は余計な色彩を落としてキャラに色を集めることで、描き込みと視線誘導は両立できるような気がしています。都市や街中、生活感のある屋内を舞台にこれを行うのはとても難しそうですが。
・マージモデルについて
かなりの精度でわたしの意図を反映したモデルになっている自負はあるのですが、今使っているこのマージモデルについて、少し飽きがきている気持ちがありますね……。
かなり雑多なマージを繰り返し、何をどれだけ混ぜたかわからずメモも取っていなかったため、再現が不可能なものになっております。
当初は単純マージであれこれ混ぜ、SuperMergerを導入してからはプリセットを使った簡易的な階層マージも行いました。
コンセプトとしては、「キャラ2.2次元、背景2.5次元」くらいの塩梅になるように調整し(直近に『CounterfeitV3.0』をドカドカ突っ込んだため、アニメ調味が強くなりすぎた感はありますが)、とにかく詳細な描き込みができるモデルにしてきました。塗りの塩梅が難しく、その時々の好みもあるのですが、新しいマージモデルを作りたい気持ちが強くなってきましたね。
新しいマージモデル作りを記事にできたら面白いなと思うのですが、SuperMergerがバグっているような気がして困っています。
人物はイラスト調の範囲に留め、背景に強く3D感を持たせるモデルのマージは本当に難しいのですが(キャラのバストアップにおいて、フォトリアル系やそれに近いモデルの要素が悪さしてまともに描けなくなる)、その課題も克服したいなと思っているところではあります。
![](https://assets.st-note.com/img/1686734500380-ma2tPXiIIf.png?width=1200)
ちなみにこちらが、使用しているLoRAを全て外し、それ以外はいつものテンプレプロンプトを使用して出力した生成物です。
ドカドカ混ぜた『CounterfeitV3.0』の影響だと思うのですが、背景の描写力が著しく落ちていてビックリしました。LoRAを使うことで回避できているので困ってはいないのですが、LoRAを使わない素のモデルでしっかり描写できるならそれに越したことはないので、やはり何らか考えていきたいところですね。
アイデアが浮かんだり、進捗があれば記事にしたいと思います。
技術的に参考にできるような記事にするつもりはあまりありませんが……。
・後書き
というわけで、途中から書きたいことが逸れていつにも増して益体の無い記事になってしまいました。
情報量は“強さ”だと言いました。
情報量を抑えることが“弱さ”であるとは思いませんが、知識を得たり装備を調えたり、そういった手段で身を守ったりちからを蓄えることも、ある種の情報量の多さに縋った結果のようにわたしは思います。
解像度が低いものって、共感が得がたいんですよね。
解像度が上がることで減る共感もまた、もちろんあるかとは思います。見たくないものは見たくないわけですからね。
しかし何にしても良いのですが、解像度が低いものってのは往々にして見せたい物への導線も失っており、細部がわからないので見ていて面白くありません。神は細部に宿るとはよく言いますが、宿る細部が無ければ神もどこかへ行ってしまうでしょう。神は必ずしも細部に宿ってくれるとも限りませんが、疎かにしないで済むのであれば神を宿らせる努力くらいは怠らないことが大事な気もします。
![](https://assets.st-note.com/img/1686735170377-qNRcaqpaku.png?width=1200)
これはわたしの外付けHDDに現存する最古の生成物です。
SE-V2-Aはとても優秀なモデルなので、
1 girl , schooluniform , silver hair , blue eyes ,
EasyNegative , (worst quality,low quality,monochrome:1.2),(bad hands:1.3),
などという雑で簡単なプロンプトからこの生成物を生成してくれます(改めてPNG infoで情報を見たらVAEを使っている形跡も無く卒倒しそうです)。
全然悪くはないのですが、やはり描き込みが足りず物足りなく見えてしまいますね。顔の表現や質感の表現などは申し分無いので、これでも全然良いのですが、しかし足りないと思ってしまうわたしは過描写教を狂信しているのでしょうか。
ともあれ面白いこと、したいですよね。
それをこの場所で発表できれば良いのですが。
以上です。
この記事が気に入ったらサポートをしてみませんか?