見出し画像

「AIイラストはなぜ抜けないか」を考えてみた


しかし、このSDにはモデルとしての弱点が存在し
その「弱点」がそのまま「エロさ」を損なっている要因となっているのではないか、と私は思い至りました。
https://note.com/yohukashi_duke/n/ne61242823964

興味深い考察のため、執筆に至りました。
まずは筆者による記事の導入部分から。

現在、様々なAI画像生成モデルが存在しますが、
スケベイラストを生成するAIとしては「Stable diffusion(以下:SD)」の一強でしょう。
pixivで投稿されている多くのスケベAIイラストもほとんどがSDによるものです。
というのも他のAI画像生成モデルといえば基本はサブスク方式であり、そもそもスケベ絵が出力できない場合が多いからです。
黎明期から存在したスケベ絵出力可能のNovelAIもSDと比べると拡張性で劣ります。
~中略~
さらに自分でベースとなるモデルを作成したり、LoRA(簡単な説明をするとゲームのMODのようなものと考えてください)によって拡張することが可能です。
https://note.com/yohukashi_duke/n/ne61242823964

こちらは同意します。
誤解を招きそうなので一筆付け加えるとしたら、Stable DiffusionにはNSFWフィルタが実装されています。

Stable DiffusionはOSS(オープンソースソフトウェア)でソースコードがオープン化されています。
よってコードを改変することによりNSFWを回避することができます。
実質的に無検閲で画像を生成できるがゆえに、NSFW画像を生成するなら拡張性も高いStable Diffusionが使われていると言えるでしょう。

私が利用しているGRAVITI Diffus(Stable Diffusion Web UI AUTOMATIC1111 ver1.7.16)はNSFWフィルタが掛けられていません。

余談ですがGRAVITI Diffusで作成したNSFW画像をオンラインのAdobe Fireflyで編集しようとしたところ、NSFW判定されてジェネレーティブ生成ができませんでした。

しかしそのAIの描き込みは全体を通して均等に行われています。
出力したAIイラストはそれ単体だと「視線誘導」が弱いのです。
背景とキャラクター、あるいは小物すべてが均一に描きこまれたイラストは「見せたいもの」の存在感が薄れていることが多々あります。
https://note.com/yohukashi_duke/n/ne61242823964

一言で言えばtxt2imgで吐き出させた修正されていないAIイラストは絵がのっぺりしていますね。

対策を考えます。

ネガティブプロンプトで out of focus つまり、ピンボケが有効です。
逆説かつ未検証ですが、「視線誘導」したい被写体に対して
focus of ~ とプロンプト入力すれば、効きそうな気がしました。
たとえば顔に焦点を当てたい場合、 focus of face というふうに。

また、生成した画像サイズをトリミング(切り取り)することで意図する構図に近づけることはできそうです。

次は、まさに筆者の格言です。

工夫次第では自分が見せたい要素を濃く出力することは可能です。
しかしそれを選別するいわゆる「絵心」や「センス」のようなものが必要となりますし、それだけ時間もかかります。
https://note.com/yohukashi_duke/n/ne61242823964

こちらも同意します。
実際に手を動かして絵を描くことができなくとも、「このイラストはいいね!」と自分の心を動かす(あるいは琴線に触れる)イラストに多く目に触れていかねば「絵心」や「センス」は磨くことはできないと思います。

その上で、「このイラストはどこが良いのだろうか」と分析して、具体的に言語化したうえでAIイラストを生成するという過程を経る必要があると感じます。

AIイラストは「絵心」や「センス」が無くともポン出しができてしまうがゆえに、巷にあふれるAIイラストは「抜けない」とも言えるでしょう。

あるいは、「抜ける」AIイラストを生成しているけれども、世には公開していない(いわゆる自家生成)ことも要因の一つかもしれません(かくいう私も・・・)
次にいきます。

私はAI手描き問わずスケベ絵は表情を中心に見ているため、目の描写がめちゃくちゃだととても萎えてしまいます。
~中略~
手はエロいんです。隠すのは非常にもったいないです。
https://note.com/yohukashi_duke/n/ne61242823964

分かります。
1ヶ月で2万3000枚ものtxt2imgによる画像生成をこなして気づいた点が二つあります。

<自分が生成したAIイラストでOKを出せない理由>
1.手指の描写が破綻、あるいは微妙
2.瞳の描き込みが足りない、変形、左右で黒目の大きさが異なる、ハイライトの入りが気に入らない

Stable DiffusionのSD 1.5 Checkpointは手指の造形を苦手としています。
というよりも、満足いくものは出せないと言っていいでしょう。
この点は別の機会で記事にします。

安易な対策として arms behind back つまり、両腕および両手を背中で覆いかくすことで回避できてしまいますが、この構図が萎えてしまいます。

表現の一つとして「腹ボコ」があります。
ひとえに「腹ボコ」といっても、 pregnant ではなくて stomach bulge です。
stomach bulge といっても形のこだわりがあるのはひとまず置いておきます。
stomach bulge系のLoraでボコッとなった腹に手を添えるポーズを組んだところ、一気にシチュエーションが高まりました。

手に変化を加えることで、元の構図に対して相乗効果が高まることは言うまでもありません。

私は一時期、それぞれ1500トークンを超えるプロンプト、ネガティブプロンプトを駆使して手指の造形の描写に取り組んだ時期がありましたが、期待する効果は得られませんでした。
そのため、onahole や amputee 系のLoraに流れたことがあります。
それはそれで萎えてしまうものです。

次は筆者の衝撃的な発言です。

まずAIイラストの少女たちは表情筋が死んでいます。カスです。
https://note.com/yohukashi_duke/n/ne61242823964

機動戦士ガンダムで敵役のジオン軍の最高司令官となったギレン総帥が本拠地で演説した際の名台詞「敢えて言おう、カスであると!! 」を彷彿とさせる発言です。
ギレンは「敢えて言おう」と前置きしてオブラートに包んでいますが、筆者は異なります。

「カスです。」


・・・。
パワーワード過ぎて、私のAIイラスト感が35億光年ぐらい吹っ飛びました

せめて、カスから雑魚(ザコ)レベルまでマシにする方法を考えつきました。

目の表現だけに限れば、「Aipictors」のLoraが豊富です。

マンガ表現17種、タレ目20種、ツリ目31種、ジト目2種、標準目8種、に加えて感情表現として「官能的な表情」2種と豊富です。

AipictorsはLoraの使用枠に制限があり、顔全体の表情をコントロールできるわけではないものの下絵として使用することで表情を豊かにすることはできそうです。

Aipictorsの弱点であったモデル数の少なさ(私の利用時は30を切っていました)ですが、2024年3月12時点でモデル数が50まで達しています。

Aipictorsで目に表情をつけた下絵を用意して、Stable Diffusionで仕上げというワークフローは現実的かと思います。

筆者は生成画像による自説の検証を経て確信に迫ります。

また「絵柄が綺麗すぎると抜けない」「少し下手な方が抜ける」という言葉を聞いたことがありますが、これは詭弁でしょう。
「絵がただ下手」なだけで抜ける訳がありませんし、それが抜ける理由とはなりえません。
「下手でも抜ける絵」というのはその人のフェチがその細部に宿っているから抜けるのではないでしょうか。
「ここを見て欲しい」「ここが好きだ」という思いがにじみ出ているから抜けるのです。
https://note.com/yohukashi_duke/n/ne61242823964

まさしくその通りだと思います。

一言で言うと「性癖(せいへき)にぶっ刺さるか否か」です。

イラスト作者(絵師という表現は私は嫌いです)のフェティズムを表現したイラストにどれだけ心を動かせられるかどうかでしょう。
「抜けるか否か」の尺度として「絵が上手いか下手か」はあまり関係がありません。

次に筆者はメインの被写体の添え役に言及しています。

目線の話に続いて竿役の話です。AIイラストは「1girl(一人の少女)」を描くことは大の得意です。
ですが、そこに竿役を一人投入すると途端に人体が破綻します。
元よりAIは人体の構造を理解しているわけではなく学習したものを「それっぽく」出力しているのです。
https://note.com/yohukashi_duke/n/ne61242823964

竿役は、私なりの表現があります。
それは、ganbang系のLoraを使うことです。
pov系のLoraでも構いません。

竿役が居ないと、after sex(つまり事後)でAV(アダルトビデオ)の終幕のようなAIイラストになってしまいます。

次に筆者は物語の連続性に言及しています。

ストーリーに関しては作者の努力と才能に依るところが多い要素です。
https://note.com/yohukashi_duke/n/ne61242823964

一貫したストーリー性を持ったAIイラストを生成して世に公開している人は、数える程度しか居ません。
ひとえに「センス」によるものでしょう。
「AIイラストが抜けない」最大の要因とも言えます。

当然、反論はあるでしょう。

「いや、差分絵を出しているでしょうが」

言い方は悪いですが、観る側にとっては「差分絵に見えない」のです。

「差分要素が少なすぎます」

動きを変化させて、かつ破綻させず流れるようなストーリーで絡みを描写することは非常に困難です。

お手本といえる(おそらく手描きもできるでしょう)作者を紹介したいところですが年齢確認の必要なR18記事にしたくないので本家サイトのURLだけ紹介します。

最後に筆者の結論です。

これらの弱点すべては「手描きによる修正」を含めた作成者の努力でどうにかなる要素です。
https://note.com/yohukashi_duke/n/ne61242823964

Stable Diffusionで完結させるなら、img2imgを駆使する必要があると受け取りました。
なお、GRAVITI Diffusのようなクレジット課金制のプラットフォームにおいては、トライアンドエラーで大量にクレジットが溶けてしまい、現実的ではありません。

結局のところ、手描きもできてセンスがあり物語性を持たせてAIツールを駆使できる作者でないと生き残れない気がします。

Stable Diffusionという化け物ツールが登場したことで、とりあえず0から1にする絵は出力することが容易になりました。
そこから「抜けるAIイラスト」に昇華させるためには、途方もない鍛錬が必要になるでしょう。
とはいえ、今まで日本人が得意としてきたことですので、私は筆者ほど悲観はしておりません。

以上です。