![見出し画像](https://assets.st-note.com/production/uploads/images/107528754/rectangle_large_type_2_7a5a27a50ef6ead4e7dadc9e0e427ccb.jpeg?width=800)
お絵かきAIで30MS的な。(ControlNet編)
自分でタイトルをつけておいてなんだけど、実質的に30MSはあまり関係なく・・・
今回はStable Diffusionの機能紹介的な。
参考にさせていただいたのこちら。
下絵的なものを使ってより簡単にイメージ通りの画像を作る、というもの。
以前書いたimg2img(↓)に近い感じだけど、ポーズだけを抽出して見栄えは別物にしてしまう、とか細かい事ができる拡張機能。
で、今回使ったサンプルはこちら。iPhoneで撮影・切り抜きした画像。
今回の記事で30MSが関係するのは実はこれだけ(笑)
![](https://assets.st-note.com/img/1686002392404-643RpJqH75.png?width=800)
まずは”Canny"。
元イメージから緻密な線画を抽出してイラストを再現する、というもの(らしい)。線画が緻密な分、自由度がなく、プロンプトで外見を指定しても、反映が限定的だったりする。
取り敢えず、画質に関するもの以外はプロンプトは”a Girl"のみ。
画像サイズは640*540で小さめなこともあって顔が崩れがちなのはご勘弁を。
![](https://assets.st-note.com/img/1686024962554-vU8SbTDqvp.jpg?width=800)
ふむふむ。ほぼ元イメージのまま。
次に“Scribble”。
”Canny"に比べると、ざっくりラフな線画を抽出する感じ。ラフなのでプロンプトでそれなりに装飾が出来る感じ。
![](https://assets.st-note.com/img/1686025148807-tX9FsyABxZ.jpg?width=800)
たまに線画にない装飾品や背景が出てくる。水着のイメージになるのか、背景が出てくるときは海が多い。ただ、ほぼ100%太もも丸出しのニーソ的デザイン、かなりの確率でヘソ出し。
最後に”OpenPause"。
骨だけ抽出してポーズを固定する感じ。上の二つに比べると、ポーズ以外の外見は全てプロンプトで指定することになるので、自由度が高い。でも自由度が高いと言うことは崩れる可能性もそこそこ高い、いや、かなり高い。
小さい画像でフルボディ描いてるから、というのもあるが。
![](https://assets.st-note.com/img/1686027886188-Iz1eRymY6B.jpg?width=800)
でも、服装の指定をしていないのに、なんとなくメイドっぽいし、ヨーロッパ中世っぽい背景なのはなぜだろう?
それはさておき、プロンプトがどのくらい影響するかの確認。
外見の設定は”miko, hakama, tabi, holding a flaming sword”です。
”flaming"はかっこよくなるかと思って、ただのオマケ(笑)
おなじ順序でまずは”Canny"。
![](https://assets.st-note.com/img/1686025811536-M2f7NpL9Et.jpg?width=800)
ポーズ・デザインともブレなく。色合いが赤白で袴っぽいだけ。線画がしっかりしてるのでそれに忠実に・・・という感じか。
次に“Scribble”。
![](https://assets.st-note.com/img/1686026022070-uVQCnMJwGJ.jpg?width=800)
やっぱり太ももニーソは変わらず。ちゃんと右手に剣を持っていると認識している。破綻もすくない。
最後に”OpenPause"。
![](https://assets.st-note.com/img/1686026300019-IVWlFk4Qqc.jpg?width=800)
衣装はプロンプトの指示が効く。でもやっぱり崩れまくり。もともとボーンデータだけで、剣はないので、”holding a flaming sword”が効いているだけということもあってか、しっかり握ってもいないし、角度もマチマチ。
もう一つオマケで、仮面ライダーでやってみた。
![](https://assets.st-note.com/img/1686030376517-vPStaRt3WT.png?width=800)
左から”Canny"、”Scribble”、”OpenPause”。
画質以外のプロンプトは"a Girl"のみ。
![](https://assets.st-note.com/img/1686030331078-QFH6wZLEOT.jpg?width=800)
”Canny”は無理があるとしても(笑)、”Scribble"や”OpenPause”は、デッサン人形でもそれなりにできる、ということ。ラフな下絵すら自分で描くのはちょっと・・・という場合は何かしらこの手のものを使えばポーズが決められる、ということだ。もっとも”OpenPause”をデザインする拡張機能もあるそうなので、それを使うという手もあるのだけど。
いずれにしろ、いろいろやってみるにはもうちょっと高性能なPCが欲しいなぁ・・・
この記事が気に入ったらサポートをしてみませんか?