見出し画像

水色の焦土とは


0.前書き


 はじめまして。こんにちは。
 水色の焦土と申します。

 わたしは3月末からstable diffusionでAIイラスト生成を始めた、しがないAIイラスト生成者です。

 生成物はこちらに投稿しております。

 元々わたしは、イラスト的なクリエーションを生業にしているわけでもなく、プログラミングの知識も皆無でした。しかし、TwitterやPixiv等で美麗なイラストを手軽に生成できると知り、最初はそれらサイトで眺めて楽しんでいたのですが、自分でもやってみようと思ったのが始めたキッカケです。

 stable diffusionの環境構築は素人にはとても難しかったですが(導入してからもしばらく四苦八苦しました。今でもバージョン更新に伴う不具合や固有の不具合に都度悩まされております)、それでもこの2ヶ月は楽しくイラスト生成を行えております。とてもたのしいですね。


1.突然noteを使い始めた理由は?

 唐突に思い付いたので始めてみました。

 技術系の試行錯誤やそれらを発信する予定はないのですが(知識がありませんので)、それ以外の何かしらを書いていければ良いのではないかと思います。見切り発車が生むものもあるでしょう。


2.AIイラストで表現しているものは?

 ここではないどこかに存在する/存在しない光景を表現したいと思っております。

 ここではないどこかに存在する/存在しない光景とは、いったい……?

 何か、そういった憧憬がずっとあります。
 イラストでもCG作品でも、マンガでも小説でもアニメでも映画でも何でも良いのですが、そういった光景を常日頃から見たいと思っております。

 具体的にそれがどういったものであるかの説明はとても難しいです。
 ですので、それをAIに吐き出させています。最近ようやく、それが出来ているのではないか? という地点に足を踏み入れられてきたような気がしています。

 そういった思いがあり、AIイラスト投稿サイトであるちちぷい様に投稿し始めました。基本的にはこの世界に存在するもので構成されているであろうモデルデータから、そういった曖昧なものを吐き出させるのはとても難しいところがありますが、「これだ!」という生成物が吐き出されたときはとてもうれしい気持ちになります。

 そういったものを、これからも作り続けていきたいと思っております。上の作者ページに並ぶ生成物から、なんとなくの傾向を読み取れるような気がしていますが、いかがでしょうか……?


3.破綻する美学とは?

 最初、アカウントページにそれだけを書き、それ以外の発信はしないつもりだったのですが、こういった場を用意したので説明致します。

 まず、AIイラストに破綻は付き物です。

 指に始まり、腕が3本4本になったり隻腕になったりもします。画面や人物を横断するようなエフェクトがイイ感じにイラストを彩ってくれたと思えば、そこで身体がぶった切られたりしますし、美少女は容易に地面から生えますし、首の上からは新たに胴体が生え、その上には美少女の破顔が乗っていたりして頭を抱えます。お前は断じて笑っている場合ではない。

(作例を出そうと思ったのですが、極度に人体が崩壊している生成物はすぐに消してしまうので手元に残っていませんでした……。あと最近のモデルはあまり破綻もしなくなっているような気もします。プロンプトのテンプレが出回ったり、わたし自身がこなれてきたせいもあるかもしれません)

 極端な話ですが、それも含めてAIイラスト生成作品である気が、わたしはしています。

 昨今は便利な拡張機能や外部機能も瞬く間に共有され、破綻をなるべく抑えたうえに手軽で簡単な生成法が確立されています。ContorolNet v1.1などは界隈に大きな衝撃をもたらしましたね。わたしもtile機能は使ってみましたが、しっくりこなかったので以降は使っていません……。

 わたしはそれらのクリエーションを「人間による人間のための表現」と勝手に呼んでおります。

 こいつは何を言っているんだと思われるかもしれませんが、現状、そういった機能を使うことでようやくそういった表現が可能になっているわけですね。逆に言えば、そういった一手間を加えない限りは、あたかも手書きで描いたような表現は実現困難だということです。

 わたしはAIイラストに対して、当初から覚えている違和感があります。

 AIイラストの画面の中には、九割九分、意図が存在しないのです。

 有志の方々が製作してくださった優秀なモデルにプロンプトを飲ませて吐き出させた、笑顔の美少女たち。とても顔の良い彼女たちは、街中でこちらに微笑み掛けたり、大自然の中でこちらに微笑み掛けたりしてくれます。その衣装は少しえっちにはだけていたり、露出度の高いものかもしれません。優秀なモデルに優秀なVAEで着色して、とてもリッチな塗りと色使いも実現しているでしょう。なるほど、とても高クオリティなイラストです。

 ですが、そこに意図、つまり「物語」はありません。

 人間が描いた時に想定しているであろう、必然性や文脈性といったものが存在しないのです。ポージングや衣装に関しても、です。自ら生成ボタンを押して現れた生成物を見て、その思いはより強固になりました。

 わたしにはそれが不憫でなりません。

 こんなに良い素材が集まっているにも関わらず、どうしてここには「物語的な意味」が存在しないのだろう、どうしてそれを読み取れないつくりになっているのだろう、と。

 それをAIに求めるのはとても残酷なことです。

 かく言うわたしも、そういった表現を追い求めようとした経緯があります。「masterpiece, best quality, 1girl, schooluniform」と入力するだけでこんなにも高クオリティな生成物が何十秒で生成されるのに、どうしてラーメンを箸で食べたり傘を差したり美少女たちに腕を組ませるのがこんなにも難しいのか! と。

 わたしは逆張りオタクですので、ならばと考えました。

 ……ならば、意識的に意図を排した生成物を作れば良いのでは?

 破綻が必然的に生まれてしまうのであれば、破綻を許容するような生成物を作れば良いのでは? 指や腕が増えたり、人体や構造物がぶっ壊れているような破綻が許容され得るものを作れば良いのです。そこにこそ、AIイラストという存在の意義があるような気がしたのです。今、この界隈はとても危うい場所に立たされています。その場所から抜け出るためには、そういったある種の特有性を持たせた表現を目指すべきだとわたしは考えました。

 九割九分に意味や意図といった「物語」が生まれず、一分を掬い上げる砂金探しをしたり、強引に意味や意図を付与し、そこで争うのではなく、始めから意味や意図を排することで、逆に意味や意図といった「物語」が生まれてくるような気がしたのです。

 ゆえにわたしは、「人間による人間のための表現」にAIを追い込むのをやめました。

 わたしは、現状のAIイラストが内包する破綻を認めています。

 それを「破綻する美学」としました。

(とはいえ、指が6本も7本も生えていたり、腕が3本も4本も生えている美少女生成物というのは、それだけで受け手の意識を分散させます。上に掲載した生成物の女の子の指は6本ずつありますが、意識的にそれらを排しようとしている方々にはさぞ気になったことでしょう。構図や美少女の表情、色使いなどがとても理想的に出力されていても、見て下さった方々は「あぁ指が6本になっていて残念だなぁ」と思うことでしょう。それはわたしの望むところではありませんので、なるべく人体に関しての破綻はなくしたいなと考えております。それらを許容した生成物という物語も現状なかなか思い浮かべていないのも理由の一つです。

作例1

 例えばこういった破綻は望むところです。水中に水が流れ落ちていたり、水中に水面がある構図はとても良い破綻な気がしています。わたしはこういったところに「物語」が生まれるような気がしていますが、いかがでしょうか?

作例2

 こちらはちちぷい様にも投稿したものになりますが、腕や指が増えるなら増やして違和感無い設定(この場合はメカ少女です)にすれば良いのでは? と思い、(multiple arms:1.2)とPPに入力して出力しました。すると胴体が無くなったのですが、望むべき破綻だったので投稿しました。「物語」が生まれた瞬間です。

 なお、この記事に特定の方々を貶める意図はありません。そう受け取れてしまったのであれば申し訳ございません。表現のための技術開拓や技術革新は望むべきものですし、新しい機能は今後どんどん開発され、より自然な表現や人間らしい表現は容易に可能になっていくでしょう。わたしが想定し得るような表現が生まれるのはこの瞬間だけかもしれません。そうなった時にわたしが何をどう考えるのかは、未だわからないところではあります)


4.使用モデルは?

 オリジナルのマージモデルです。
 でょ氏製作の「SE-V2-A」を素体にしておりますが、度重なるマージを繰り返したことでその要素が残っているかは疑問です。(なお「SE-V2-A」モデルは現在入手出来ません)

 ライセンス問題を何も考えずにマージを繰り返してしまったため(マージに使用したモデルのメモも取っておりません……)、モデルの公開などは考えておりません。


5.PCスペックは?

 ゲーミングノートPCです。
 CPUはi7-9750H、メモリ16GB、GPUはRTX2070 with Max-Q(VRAM8GB)とあまり良い環境ではありませんが、ローカル環境でギリギリ使える……使えない……くらいの環境です。
 あたらしいぱそこんがせつじつにほしいですね……。


6.後書き

 ここまで読んで下さりありがとうございました。
 何か質問等があれば気軽にコメントしてください。

 また気が向いた時に何かを書きます。飽き性ですので、あまり期待はしない下さい。

 以上です。

手や指の破綻よりも、こういった枠やテキスト的なあれやロゴマーク的なあれが出てくる方が困ると思うのはわたしだけでしょうか……?


この記事が気に入ったらサポートをしてみませんか?