見出し画像

AIイラストはなぜ抜けないのか

まえがき

MidjourneyそしてNovelAIといった
「AIイラスト」登場の衝撃からおよそ1年が経過しました。

この1年でAIイラストは着実に成長を重ねています。
つい最近では「DALL-E3」が登場し、簡単な文章を入力するだけで
高精細なAIイラストを生成することができるようになりました。
クオリティは既存のAIイラストを凌駕するレベルで、
これを無償で誰でも利用できるというのだから驚きです。

ゴリラサムライ by DALL-E3
メカペンギンVSキングアルパカ by DALL-E3

私はNovelAIからこの界隈に足を踏み入れ、少し期間を置いた後に
Stable Diffusionの存在を知ってAI生成沼にハマり半年が経ちました。
現在、飽きもせず日々画像生成を楽しんでいます。
pixivでも活動をしていまして、
ありがたいことに6500人を超える方々にフォロー頂いています。
そのpixivで公開している画像の大半がスケベ絵なわけですが、
その立場からあえて言わせて頂きます。
「AIイラストは抜けない」と。

あまりにも主語がデカすぎたので少しだけ訂正します。
「大半のAIイラストは抜けない」です。
これは私個人の意見ではなく、ネット上でも多く耳にする言葉です。

しかし人の手で描かれたイラストもPCやスマホの画面で見る以上、
結局はただの「線」と「色情報」集合体でしかないはずで、
描き手の「温もり」や「魂」などといったものは鑑賞者の錯覚でしかありません。しかしその錯覚を引き起こす力がAI絵にはまだないことも事実です。

それでは「なぜAIイラストは抜けないのか」
そして「エロさ」とは何なのかを
AIイラスト生成者の立場から考察していこうと思います。

あくまでも私個人の主観を多分に含んだ考察となります。また、「俺はこれがエロいと思うんだからお前ら全員こうしろ!」と偉そうなことを言うわけでもないので、一人の勝手な意見として気楽に読み飛ばしてください。

そもそもAIイラストは「エロ」と相性が悪い

現在、様々なAI画像生成モデルが存在しますが、
スケベイラストを生成するAIとしては「Stable diffusion(以下:SD)」の一強でしょう。
pixivで投稿されている多くのスケベAIイラストもほとんどがSDによるものです。というのも他のAI画像生成モデルといえば基本はサブスク方式であり、そもそもスケベ絵が出力できない場合が多いからです。黎明期から存在したスケベ絵出力可能のNovelAIもSDと比べると拡張性で劣ります。
SDはそれなりスペックの高いPCが要求されますが、ローカルで環境を構築することが出来るため、気に入らなければ何度も出力することが可能です。
それによって追加で掛かる費用は電気代くらいです。
さらに自分でベースとなるモデルを作成したり、LoRA(簡単な説明をするとゲームのMODのようなものと考えてください)によって拡張することが可能です。

しかし、このSDにはモデルとしての弱点が存在し
その「弱点」がそのまま「エロさ」を損なっている要因となっているのではないか、と私は思い至りました。
それぞれ解説していきます。

描き込み

AIイラストを想像すると皆さんはどのようなものを想像するでしょうか?
「人力作業ならとてつもない時間がかかるほどの描き込み、あるいは光源への理解が高いハイクオリティなイラスト」といったところでしょうか。
しかしそのAIの描き込みは全体を通して均等に行われています。出力したAIイラストはそれ単体だと「視線誘導」が弱いのです。背景とキャラクター、あるいは小物すべてが均一に描きこまれたイラストは「見せたいもの」の存在感が薄れていることが多々あります。
工夫次第では自分が見せたい要素を濃く出力することは可能です。しかしそれを選別するいわゆる「絵心」や「センス」のようなものが必要となりますし、それだけ時間もかかります。

さらにAIイラストは一見すると美麗ですが、目や手指、そして乳首といった小さい領域に描きこみが必要とされる部分を苦手としていて、髪も融合していることが少なくありません。
私はAI手描き問わずスケベ絵は表情を中心に見ているため、目の描写がめちゃくちゃだととても萎えてしまいます。この表情とは顔だけではありません。手指の繊細な動きもキャラクターの表情と言えるでしょう。
「爪痕が残るくらい強く掴む」「力が抜けて開いた手」「愛おしそうに局部を愛撫する」…など、キャラクターの心理とリンクするための重要な要素です。手はエロいんです。隠すのは非常にもったいないです。

表情

続いてその「表情」について考察していきますが、まずAIイラストの少女たちは表情筋が死んでいます。カスです。
これについてはSDモデルの特徴として「表情の操作が難しい」ことが大きな原因です。少し技術的な面の話をします。
AIイラストを生成する際に使用する指示文を「プロンプト」と呼ぶのですが、この「プロンプト」で「眉毛の形」「目の形」「口の形」をそれぞれ指示することは非常に難しいのです。
というのも、日本語では「微笑」「苦笑」「馬鹿笑い」「冷笑」「嘲笑」「はにかみ」「照れ笑い」…など「笑顔」についての表現がたくさんあります。皆様も字面を見ただけで「あーこんな感じね」と頭に浮かんだと思います。
ですが、AIからしてみるとこれらの区別はついておらず全てが「smile」なのです。「smile」という体系の要素の一つに「微笑」や「嘲笑」などが存在しているのです。

画像を例を出して見てみましょう。
「1girl, smile(少女が笑う)」というプロンプトがこちらです。

こちらを「嘲笑」にしてみようと思います。
「1girl, smile, grinning, look down, from above(アオリ視点で少女が見下ろしてにやにや笑う)」という風にすると、このようになります。

まだまだ嘲笑にはほど遠いですが、多少はそれっぽさが出てきました。
「grinning(にやにや)」が与える影響が口だけなのが惜しいです。
ややこしいのですが、表情は表情を直接指示するプロンプトだけではなく、シチュエーションのプロンプトに付属することもあります。
この場合は薄くですが「look down(見下ろす、見下す)」の要素に嘲りが混じっている…のではないかと考察されます。

さらにこちらのイラストに手を加えてみましょう。

ざぁこ❤

はい。幻聴が聴こえてきましたね。
並べて見てみましょう。

ほんの少しの線と角度ですが「眉毛の形」と「瞼の開き具合」が表情に与える印象が非常に大きいものと分かります。
こちらは自作した専用の表情LoRAを使用し、
inpaint(イラストの指定した箇所を描き変えるSDの機能)によって作業しています。クリスタなどのイラスト制作アプリで歪みツールなどで簡単に描き変えることも手っ取り早いでしょうし、その上でinpaintを行うことでたとえ絵心がなくても似たような絵は作れます。

とはいえ、プロンプトで指示を出せないのは非常に悩ましい問題ですね。
修正をハードルが高いと感じる人も多いようです。

(蛇足ですが、最近自分が行っている細部の修正について、記事の最後の方でおまけとして載せていますので気になる方は是非ご覧ください)

そして次の「絵柄」ともリンクする話ではありますが、私自身、可愛い顔した女の子が「下品なイキ顔」をしていることに興奮を覚える性質です。
二次元イラストにおける「イキ顔」とはデフォルメ・誇張表現が強いため、一歩間違えればギャグ漫画のようなテイストになってしまいます。
「美麗な絵柄」で「イキ顔」を行うと落差に違和感を感じてしまうために、「やろうとしても出来ない」AI生成者も少なくないでしょう。
「美麗なマスピ顔」は「漫画的なデフォルメ表情」と相性が悪いのです。

AIイラストのイキ顔は不感症のような微笑み顔(light smile)やお決まりの眉毛の角度の苦悶顔(angry)ばかりで、私はそこにエロさは感じません。

表情については他にも色々言いたいことはあり、二次創作における解釈違いのイキ顔についても語りたいのですが、本筋から逸れるため割愛します。

絵柄

さて、AIイラストには特有の絵柄が存在します。
いわゆる「マスピ顔」と呼ばれる「万人に受ける綺麗な絵柄」ですね。
しかし「AIイラストっぽい」と呼ばれてしまうものでもあります。
簡易的な説明ですが、高品質なイラストを出力するときに使用される「masterpiece」というプロンプトに由来します。

best quality, masterpiece, high resolution,1girl,school uniform,

…こんな感じでしょうか?
さて、万人受けする絵柄と述べましたが、すべての人にとって「これが一番好きな絵柄だ!」というわけではないと思います。私もその一人です。
個人の趣向ですが、特に眼の形があまり好きではありません。
しかしX(旧Twitter)でバズっているSDのAIイラストの多くはこのマスピ顔がベースとなっているため、好かれる絵柄であることは間違いないでしょう。
しかしあまりにも綺麗な絵柄のため、前述したように強めのアヘ顔や、その他漫画的な表現をさせるのは難しそうです。

pixivのAIイラストのランキングを見てみると、アニメの絵柄そのままの二次創作イラストが多くランクインしています。

SPY×FAMILYのヨル・フォージャーさん

上記画像はアニメのスクリーンショットで学習したLoRAモデルを使用しています。多少は使用モデルの特徴が出るもののアニメの絵にとても忠実です。
「画風再現」は手描きでもかなり人気のあるジャンルです。
原作やアニメからそのまま抜け出してきたような絵柄は解釈不一致が発生し辛く、背徳感もあり人気なのも頷けます。さらにAIが得意とする分野です。一転してこちらは「AIで抜ける要素」の一つでもあります。
(私も嫌いではありませんが、私は手描き・AIに限らず作者のフェチ要素がある程度介入したイラストが好きです)

また「絵柄が綺麗すぎると抜けない」「少し下手な方が抜ける」という言葉を聞いたことがありますが、これは詭弁でしょう。
「絵がただ下手」なだけで抜ける訳がありませんし、それが抜ける理由とはなりえません。
「下手でも抜ける絵」というのはその人のフェチがその細部に宿っているから抜けるのではないでしょうか。「ここを見て欲しい」「ここが好きだ」という思いがにじみ出ているから抜けるのです。さらに下手=描き込みが多くない絵とするなら、その「見て欲しい」部分は一層目立って見えるのも、良い方向に作用しているのでしょう。

目線

AIイラストは学習元の影響により「looking at viewer」という視聴者側に目を向けるという要素を強く持っています。これは1枚絵としては目を引く要素ではありますが、エロに限っては必ずしも良いものとは言えません。
竿役が存在する場合でも局部ではなく、こちらを見てくるので女性側がオーガズムに達しているようには見えず、興ざめです。
「〇んぽに集中しろ!」と、エロ同人の竿役のような気分になります。

またこれだけAI技術が発展していっているのにAI作画による漫画で「ようやくAI漫画の時代が来たな」と言われる作品が出ないのもこの影響があるでしょう。常にこちらに語り掛ける構図では世界の広がりを感じません。

なお「DALL-E3」ではプロンプトだけでどうやら漫画を描けるという情報がありまして、近いうちにAI生成による「漫画らしい漫画」がそろそろ誕生する気配がありとても楽しみです。

竿役の絡み

目線の話に続いて竿役の話です。AIイラストは「1girl(一人の少女)」を描くことは大の得意です。ですが、そこに竿役を一人投入すると途端に人体が破綻します。元よりAIは人体の構造を理解しているわけではなく学習したものを「それっぽく」出力しているのです。
物体を立体的に学習しているわけではないので何かの「重なり」があると途端に崩れます。その「重なり」や「密着」によって生まれる「女体の柔らかさ」と「男体の硬さ」の表現がエロさに繋がるわけです。

そして再び私の性的趣向の話になります。私は体格差フェチでもあるのですが、この体格差の表現がとても難しい。キャラクターを二人以上出す時「size differece(サイズ違い)」というプロンプトを入れても上手く機能しません。

ストーリー性及びキャラの同一性

ストーリーに関しては作者の努力と才能に依るところが多い要素です。「目線」の項目で軽く触れましたがAIによる漫画は難しい部分がありますし、それ特有の技術も必要となります。よってAIイラストにストーリー性をもたせる場合はイラストCG集の形式がベターとなるでしょう。もちろんCG集にも漫画的技法が必要となりますが、一旦その話は置いておきます。

そしてストーリーのある作品ということは、同一のキャラクターが複数の場面・構図で登場するわけです。このキャラの再現がAIでは地味に難しい。
キャラクターのLoRAを使用することである程度は同一性を保持できますが、顔の向きやアオリ・フカンといった構図によって「君なんかさっきと顔違くない?」といったことが多々あります。それは目の大きさであったり、顔のパーツの配置であったりします。表情の項目で触れましたが、眉毛の角度一つで二次元イラストのキャラクターはガラリと雰囲気が変わります。
同一性を保持するためには望んだ顔が出るまで出力し続けるか、構図を優先して修正を加えるしかないのです。

動きと柔らかさ

「動きのある絵」を描くのはとても難しいです。1枚絵を得意とするプロのイラストレーターですら漫画に挑戦して失敗した、という話をよく耳にします。この「動きのある絵」はイラストとは別の技術が必要となります。
スケベ絵の分野においては主にピストン運動や乳揺れなどを表現する上で必要となる技術です。これに関してはプロンプトのみで出力はほぼ不可能です。専用のLoRAを使用するか自力で描きこむしかありません。

柔らかさに関しても同様のことが言えます。AIイラストのおっぱいは、なんだかとても硬い……空気のパンパンに詰まった風船のようです。
おっぱいに限らず女体というものはもっと「もっちり」あるいは「艶」っとした質感であるものが、個人的には好きです。
これについての解決策は塗りを変えるべきなのか、あるいは他の方法があるのか私自身も模索している最中です。

手前味噌で恐縮ですが下記のイラストではおっぱいの柔らかさを少しばかりは表現できたのではないかと思っております。
一度出力したベースとなる画像に手を加えています。


「AIイラスト」という情報そのもの

そもそも「AIイラスト」というものを毛嫌いしている人もいるでしょう。
そんな人はこの記事を読まないと思いますが…「AIで抜く=負け」だと考える人もおそらくいることでしょう。
否定はしませんが、最初に述べたように結局のところイラストは全て「線」と「色情報」の集合体だと言うのが私の見解です。近い将来必ずAIイラストと手書きのイラストの区別がつかなくなる日が来ます。そんな時代がきてなお、抜く前にAIイラストか手描きイラストか調べるなど不毛な行いでしかありません。

私自身、AIイラストにハマったキッカケはpixivで手書きだと思ってクリックしたイラストがAIイラストだったからです。当時はまだAI生成を示すためのタグ付けは強制されておらず、非表示にする項目も存在していませんでした。ですので騙されたという感情は湧かず、素直な驚きと感心のみでした。

そして「ここまで出来るなら自分もやってみよう」という気持ちで今に至るわけです。

というわけで…

と、それぞれSDにおけるAIイラストの弱点を挙げてきましたが、
これらの弱点すべては「手描きによる修正」を含めた作成者の努力でどうにかなる要素です。
「うるせーAIイラストにそこまで求めてねーよ!」という意見もあると思います。しかし私はこれら列挙した要因が気になる性質なのです。
ですので「うるせー気になって抜けねーんだよ!」と返させていただきます。

この記事が「自分が出力したAIイラストをもっとエロくしたい!」と思うAI生成者の方のお役に少しでも立てれば幸いです。
そして「自分はここが気になる」という点がありましたらコメントしていただけますと参考になります。

おまけ「細部の描き込み」を増やす

さて、ここからはおまけです。
私が最近行っている細部の書き込みを増やすちょっとしたテクニックを掲載します。それでは先ほどの嘲笑イラストの顔の書き込みを増やします。

まずは画像の顔部分をクロップします。

この時画像のサイズは512×512程度が良いでしょう。
注意点として縦横の比率は自由で良いのですが、i2iではピクセル数が8の倍数でないと強制的に比率が変わるので注意してください。
そして赤枠部分をinpaintで囲い、
1024×1024など大きな解像度で出力します。

書き出されたものがこちらです。比べると口の中がハッキリとし、眉毛や髪の溶けがなくなっていることがわかりますね。
inpaintですので描きこまれたのは顔の部分だけです。
この1024×1024で出力した画像を元の512×512に縮小し、元の場所に当てはめれば一部描き込みを増やしたイラストの完成です。

簡単ですね。こちらは手指などのそのほか小さな領域に描き込みが必要な場合にも上手く機能します。
この作業は元の1024×1536をinpaintでtile diffusion(アップスケール)する作業と似ていますが、それに比べると軽く圧倒的に時間がかかりません。
多少雰囲気を変えつつ描きこみを増やす作業でオススメです。

以上となります。それでは良いAI生成ライフを。

この記事が気に入ったらサポートをしてみませんか?