見出し画像

stable diffusion~二次絵に関する考察(4)

ついに今ブームのStable Diffusionを使ったエロに関する話です。
前々から二次絵(アニメ風)と三次絵(写実風)の段差について
色々試してみています。

同じプロンプト・コマンドを用いて繰り返してみて、
漫画・アニメの時代から言われていたことの再確認が
できたのでつらつら書いてみます。

結論としてアニメ絵と写実絵は何が違うのかというと

① 眼の大きさ
② 頭部が二次絵は大きい
③ ①②の結果、身体と頭部のバランスが実際の人間と違っている

トップ画像にあるような絵がその特徴を持っていますね。

この3点が大きな違いです。
それ以外は些末な違いで、そんなに言うほどのものではありません。

ただ、これは自分が子供の時代の漫画絵から指摘されていることで
さほど新しい発見ではありません。

このStable Diffusionのモデル、どうやって制作しているかは
わからないのですが、おそらく出発点から違うであろうと
思われます。

デッサン、似顔絵の指南本を読むと、
この①②は子供の特徴として挙げられています。

なるほど、この子供の顔という認識はなかなか強力で、
哺乳類全般に敷衍できるものです。
子犬、子猫がすぐにわかるのもそのためです。

「妖艶な女性」が出てきにくいという特性は
ここからきているものと思います。

Stable Diffusionのモデル、多種多様なものがあるのですが、
二次絵には3つの特質がしっかりあり、写実絵にはありません。

noteで指摘している方がおられますが、
AIの作った絵というのは
ステレオタイプな、すべて均等になる記号のようなもので、
店売りのラーメンを、インスタント麺にしたような感じです。

なかなかうまいたとえだなと思います。

写実絵にしたところで、実際の写真の表現にはかなわない。
かなり似せてはいるけど、ラーメン屋で出てくる
ラーメンのうまさや、質感とは違うもの。

顔を入れ替えると違和感は中和されますが、
もともとの顔ではなくなってしまう傾向にあります。

loraでいろんなものを付け足す方法は、
いわばトッピングのようなもので、
全体の質をよく変化させるようなものにはなかなかならない。

この記事が気に入ったらサポートをしてみませんか?