お絵かきAIで30MS的な。（ControlNet編）

2023年6月6日 18:00

自分でタイトルをつけておいてなんだけど、実質的に30MSはあまり関係なく・・・
今回はStable Diffusionの機能紹介的な。
参考にさせていただいたのこちら。

下絵的なものを使ってより簡単にイメージ通りの画像を作る、というもの。
以前書いたimg2img(↓)に近い感じだけど、ポーズだけを抽出して見栄えは別物にしてしまう、とか細かい事ができる拡張機能。

で、今回使ったサンプルはこちら。iPhoneで撮影・切り抜きした画像。
今回の記事で30MSが関係するのは実はこれだけ(笑)

まずは”Canny"。
元イメージから緻密な線画を抽出してイラストを再現する、というもの（らしい）。線画が緻密な分、自由度がなく、プロンプトで外見を指定しても、反映が限定的だったりする。
取り敢えず、画質に関するもの以外はプロンプトは”a Girl"のみ。
画像サイズは640＊540で小さめなこともあって顔が崩れがちなのはご勘弁を。

ふむふむ。ほぼ元イメージのまま。

次に“Scribble”。
”Canny"に比べると、ざっくりラフな線画を抽出する感じ。ラフなのでプロンプトでそれなりに装飾が出来る感じ。

たまに線画にない装飾品や背景が出てくる。水着のイメージになるのか、背景が出てくるときは海が多い。ただ、ほぼ100％太もも丸出しのニーソ的デザイン、かなりの確率でヘソ出し。

最後に”OpenPause"。
骨だけ抽出してポーズを固定する感じ。上の二つに比べると、ポーズ以外の外見は全てプロンプトで指定することになるので、自由度が高い。でも自由度が高いと言うことは崩れる可能性もそこそこ高い、いや、かなり高い。
小さい画像でフルボディ描いてるから、というのもあるが。

でも、服装の指定をしていないのに、なんとなくメイドっぽいし、ヨーロッパ中世っぽい背景なのはなぜだろう？

それはさておき、プロンプトがどのくらい影響するかの確認。
外見の設定は”miko, hakama, tabi, holding a flaming sword”です。
”flaming"はかっこよくなるかと思って、ただのオマケ(笑)

おなじ順序でまずは”Canny"。

ポーズ・デザインともブレなく。色合いが赤白で袴っぽいだけ。線画がしっかりしてるのでそれに忠実に・・・という感じか。

次に“Scribble”。

やっぱり太ももニーソは変わらず。ちゃんと右手に剣を持っていると認識している。破綻もすくない。

最後に”OpenPause"。

衣装はプロンプトの指示が効く。でもやっぱり崩れまくり。もともとボーンデータだけで、剣はないので、”holding a flaming sword”が効いているだけということもあってか、しっかり握ってもいないし、角度もマチマチ。

もう一つオマケで、仮面ライダーでやってみた。

左から”Canny"、”Scribble”、”OpenPause”。
画質以外のプロンプトは"a Girl"のみ。

”Canny”は無理があるとしても(笑)、”Scribble"や”OpenPause”は、デッサン人形でもそれなりにできる、ということ。ラフな下絵すら自分で描くのはちょっと・・・という場合は何かしらこの手のものを使えばポーズが決められる、ということだ。もっとも”OpenPause”をデザインする拡張機能もあるそうなので、それを使うという手もあるのだけど。

いずれにしろ、いろいろやってみるにはもうちょっと高性能なPCが欲しいなぁ・・・

この記事が気に入ったらサポートをしてみませんか？