Stable Diffusion - ControlNet入門(1) ControlNetとは？

2024年2月11日 01:29

割引あり

このシリーズでは、より意図した通りの画像を生成するのに役立つ Stable Diffusion の拡張機能『ControlNet』の概要について解説します。今回は第1回目として、ControlNet の概要やできることを解説していきます。

ControlNetの概要

ControlNet は、2023年2月に論文「Adding Conditional Control to Text-to-Image Diffusion Models（テキストから画像への拡散モデルへの条件制御の追加）」で発表された Stable Diffusion の派生拡張技術です。プロンプトに加えて画像や姿勢を入力することで、プロンプトのみでは指示できない複雑な構図や、文字で説明することが難しいポーズ、元画像のキャラクターを再現した画像などを生成することが可能になりました。
主な開発者は論文の主著者である lllyasviel 氏（Zhang Lvminさん）で、2023年12月現在、lllyasviel 氏の GitHub や Hugging Face で技術の詳細やモデルが公開されています。現在の最新版は1.1です。
https://github.com/lllyasviel/ControlNet-v1-1-nightly
また Mikubill 氏が ControlNet をAUTOMATIC1111で使用するための拡張機能をオープンソースで公開しています。

ControlNet は、Stable Diffusion の拡散モデルによる空間的条件制御を追加するニューラルネットワークの技術ですが、いくつかの「プリプロセッサ」から構成されています。これは ControlNet の特徴で、t2iによる画像生成の条件制御として働きます。画像からポーズを抽出する「openpose 」や、輪郭線を抽出する「canny」などをまとめて「プリプロセッサ」と呼びます。各プリプロセッサを目的に応じて使い分けることで、t2iでは制御が難しい構図や姿勢などを制御し、より意図した通りのイラストを生成することができます。

i2iとの違い

「画像とプロンプトをもとにして新たな画像を生成する」と聞くと i2i を想像するかと思いますが、 i2i と ControlNet は完全に別の技術です。

i2iは画像全体の特徴を捉えて類似画像を生成するのに対し、ControlNetは画像上の情報（線画、境界線、姿勢、深度情報など）を解析し、より詳細な制御に基づいて画像生成を行います。
i2i の記事で試したように、Denoising strength の値を増やすことで画像の雰囲気を保ったまま構図やキャラクターに変化をつけることができますが、Denoising strengthは画像生成におけるノイズ除去パラメータです。構図やキャラクターを変える機能はありません。

ControlNetは、画像とプロンプトをもとにして新たな画像を生成する技術です。i2iとは異なり、画像上の情報（線画、境界線、姿勢、深度情報など）をコンピュータビジョンによって「プリプロセッサ」として事前に解析し、その情報を空間的制約条件にして制御に基づいて画像生成を行います。つまり特定の要素の特徴のみを画像から抜き出して画像を生成することができます。例えば、このように元画像のポーズを再現することができます。

これは「openpose」というプリプロセッサで、写真の人物のポーズと表情を3D座標（正確には各関節の行列）として抽出し、それを参考にキャラクターにポーズをとらせた画像を生成することができる機能です。1枚目がフリー素材サイト「Pexels」からダウンロードした画像、2枚目が openpose で抽出した人間の姿勢、3枚目が生成された画像です。生成画像の姿勢のみが元画像の通りで、人物や服、画像の雰囲気は全く異なっている拡散モデルによる生成になっていることがわかります。
このように、ControlNet はプリプロセッサによる制約条件を導入することで、より自在に画像を生成することができるパワフルな技術です。

ControlNet 入門シリーズでは、次回から ControlNet の導入方法を解説していきます！

img2img 入門シリーズはこちらから。

※本ブログは発売予定の新刊書籍に収録される予定です。期間限定で先行公開中しています。
メンバー向けには先行してメンバーシップ版をお届けします
Stable Diffusionをお手軽に、しかもめっちゃ丁寧に学べてしまう情報をシリーズでお送りします。
メンバーは価値あるソースコードの入手や質問、依頼ができますので、お気軽にご参加いただければ幸いです！

この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。
メンバーシップ向けサポート掲示板はこちら！応援よろしくお願いします！

ここから先は

80字

この記事のみ ¥ 0〜

期間限定 PayPay支払いすると抽選でお得に！

生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる…

このメンバーシップの詳細

Stable Diffusionをゼロから学ぶマガジン

¥500 / 月

初月無料

GPUがなくてもいける！「Stable Diffusionをゼロから学ぶマガジン」です Google ColabだけでStable Diffusionをお手軽に、しかもめっちゃ丁寧に学べてしまうシリーズをお送りします。メンバーは価値あるソースコードの入手や質問、依頼ができます

ソースコードの優先入手や動作に関する質問ができます
AICU Discord「クリエイターユニオン」への参加リンク
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

AI用語集ライター

¥1,000 / 月

初月無料

日々生み出されていく生成AIの用語集をユニオンのメンバーみんなで編纂しています。メンバーは新規・公開前の用語集を閲覧できます。品質の高いエントリーを投稿したメンバーには謝礼をお送りしています。誰よりも早く品質の高い原稿を書いて社会に生成AIの品質の高い情報を伝えよう！

新規のAI用語を投稿できます（採用時は謝礼あり）
AICU Discord「クリエイターユニオン」への参加リンク
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

漫画製作のための画像生成AI

¥3,000 / 月

初月無料

プロフェッショナルな漫画製作のための画像生成AI技術や関連ツール活用技術に加えて、サンプルデータなどを[漫画製作メンバー特典マガジン]で提供します。 TwitterDMやDiscordでのAICUクリエイティブチームへの個別相談どうぞ。

Discordでのご相談（申請）
TwitterDMでのご相談
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

ログイン

この記事が気に入ったらサポートをしてみませんか？

Stable Diffusion - ControlNet入門(1) ControlNetとは？

ControlNetの概要

i2iとの違い

ここから先は

メンバーシップ ¥ 500~ /月

Stable Diffusionをゼロから学ぶマガジン

AI用語集ライター

漫画製作のための画像生成AI