ControlNetのモデルの種類・使い方14つ / Stable Diffusion

倉田優希｜AI研究ノート🧪

2023年8月15日 16:54

ContorolNetのモデルの種類と各々の使い方についてのメモです。

輪郭抽出(線画)でポーズしたい時 / canny

初心者でも使いやすく、一番忠実にポーズ指定ができる。
人物などの輪郭を保ったまま、プロンプトで一部分を変更したい時にもおすすめ。

プリプロセッサ：canny
モデル：control_canny-fp16

ポーズに加えて、顔や髪型・服装も類似して生成しやすい。
抽出された輪郭画像も同時に出力されるため、保存をして画像を再利用できる。

アップロードした画像

生成された画像(プロンプト無し)

生成された輪郭画像

骨格検出でポーズ指定したい時 / openpose

元画像から棒人間を抽出し、ポーズ指定できる。
洋服や背景は全く別のものが生成されるため、ポーズだけ反映させたい時に使用する。

プリプロセッサ：openpose_full
モデル：control_openpose-fp16

骨格の抽出画像も生成されるため、保存をして画像の再利用ができる。

アップロードした画像

生成された画像

生成された骨格画像

棒人間でポーズ指定したい時

先ほど生成した棒人間の画像を使って画像を生成するには、プリプロセッサはnoneにして、モデルはopenposeを使用する。

プリプロセッサ：none
モデル：control_openpose-fp16

アップロードした画像

生成された画像 (プロンプト無し)

一部分だけ編集したい時 / inpaint

一部分だけ編集したい時に使用する。編集したい箇所をwebページ上の黒色のペンで塗りつぶす。

プリプロセッサ：inpaint_only
モデル：control_v11p_sd15_inpaint

アップロードした画像

黒く塗りつぶした画像

生成された画像

高画質化したい時 / tile

画像を拡大して高画質化してくれる。拡張機能の『Tile Diffusion』と合わせて使うのがおすすめ。

プリプロセッサ：tile_resample
モデル：control_v11p_sd15_tile

tileで512px✖️512pxで生成した画像

tileで1024px✖️1024pxで生成した画像

同じ顔を引き継いで生成したい時 / reference

アップロードした画像の顔を引き継いで色々な画像を生成できる。

プリプロセッサ：reference_onty
モデル：なし

アップロードした画像↓

生成された画像↓

イラストの線画から抽出したい時 / Lineart

イラストから抽出した線画をベースに画像を生成する。
線画の画像を使えば、ControlNetで色塗りができる。

▼ Lineartのプリプロセッサの種類
① lineart_anime
② lineart_anime_denoise
③ lineart_coarse
④ lineart_realistic
⑤ lineart_standad(from white bg & black line)

プリプロセッサ：Lineart_Anime
モデル：control_v11p_sd15s2_lineart_anime

アップロードした画像

生成された線画の画像

生成した線画を利用して、色塗りをし直すやり方

①先ほど生成された線画をアップロード

②プロプロセッサをnone、モデルをcontrol_v11p_sd15s2_lineart_animeにする

③プロンプトを入力して調整する

④元画像をseedで固定している場合は、seed数値も入力するとより忠実に生成できる

Lineartの比較

線の太さや色味の質感の違いが楽しめる。

線画を忠実に抽出したい時 / Soft Edge

イラストの線画を抽出してくれる。cannyやLineartよりもより細かな細い線を抽出してくれ、より元画像と似せて生成してくれる。

▼ プリプロセッサの種類

softedge_hed：元画像に最も忠実な線画を抽出してくれる

softedge_hedsafe：softedge_hedより抽出精度を下げ、不自然にならないようにしてくれる

softedge_pidinet：softedge_hedより細かく線を抽出してくれる

softedge_pidisafe：softedge_pidinetより精度を下げ、不自然にならないようにしてくれる

モデル：control_v11p_sd15_softedge