見出し画像

PixAI リアルタイム生成

BingのImage Creator (DALL-E) が中々好みのロボット君の絵をだしてくれる事にきがつきました。

100枚位出力して、LoRAを作る。

ついでにStable Diffusion の初期の頃にもやってましたが、
物語の挿絵を描いてもらってました

よし、次はガリバー旅行記だ!

これはこれでモノクロの挿絵としてはいいのですが、
もう少し絵本っぽい画像が欲しい。
せっかくだから、島民を手のひらに乗せている画像ください。

お、いいですね。他の画像も作ってくれませんか?

・・・可愛いくない。・・・というか、何だか色々変。
うん、しかし巨人と小人の対比は面白いな。

キングコングはどうだ?ありゃ?コンテンツポリシー?に引っかかる画像になったとか。美女がセクシーだったのかね。

思い出したのが以前から巨大ロボットの画像などを生成してる時にできなくて、その時はあまりよく考えずにスルーしていたシチュエーション。

こんな風に手のひらに人物乗せて運んだりするシーンって、
アニメでは結構あるじゃないですか。

Stable Diffusionでやってみようか・・・と思ったが、
プロンプトだけでは巨大な手と人物を並べようと思ってもできないんですよね。一応、こういったLoRAもあるのですが。

せっかくだから、ちょっとリアルタイム生成でチャレンジしてみようと思います。
最近はLCM などで相当高速にはなってるのですが、うちのPCはVRAM 4GBの時価2万円PC。生成サービスのリアルタイム生成の速度には適いません。
そんな訳でまたPixAIを利用します。

元々この記事を書く予定はなかったので、画像のキャプチャはしてませんでした。最初の3枚だけ後から適当に作りなおしてます。
こんな手順でやってたという事で。

適当に手の絵を描きながらAIに清書してもらいます。
比重は低めにするほど左画像に近似します。
右側の絵をダウンロードして、左側を一旦クリア。
左側にAIに清書してもらった画像を読み直します

画像は拡大・縮小・移動ができますので必要に応じて適宜調整します。

手だけなら普通に認識してくれますが、ここに小人を描き足すと
段々認識しなくなっていきます。

小人を描きながら、キャラクタの特徴をプロンプトに追加していきます。

ここからダウンロードして残ってた画像。
小指が隠れてしまったので足を延ばします。

描き足してはAI清書をダウンロードして、また読み込み。
・・・しているうちに指がどんどん遠ざかっていく。

img2imgに参考画像として読み込み、Strength 低めで出力。
私はこの記事ではMidsummerモデル使ってます。
さらにそれをコントロールネットでHEDあたりを使って出力。

ちなみにプロンプトにOne HandとかGiant Left Hand とか色々書いてみるのですが、AIは「これが手な訳はない、シーツに違いない」と勝手に解釈してくれる・・・
Strengthでギリギリの場所を探す必要があります。

女の子の手が短すぎた。
直してもいいのですが、親指以外の指も離れすぎてしまったので
描き直す事にします。

また手が崩れ始める。

これで一旦、Image2Image (参考画像にアップロード)に通してみますが・・

女の子の手が顔と林檎になってしまった。
ごちゃごちゃ固まると判別しにくくなるなぁ、手を広げよう。
あと、足の間の巨人の手のひらの部分が太もも化してる。
足の向きをこちらに変えよう。

Img2Imgにかけます。

イメージエンハンスで拡大しますが、私はいつもクレジットコストがかからない範囲でやってます。
512*512px → 1024*1024px (2.0倍)
ノイズ除去 0.2

こんな所でしょうか。はい、一時期流行った小さいおっさんならぬ
小さいお嬢さん捕獲しました。

この記事が気に入ったらサポートをしてみませんか?