見出し画像

実際に使用しているSD WebUIのお勧め拡張機能をご紹介!


はじめに


今回は、いつものニッチな記事ではなく、ゆるーくやっていこうと思います!
私が実際に使用しているSD WebUIの拡張機能を紹介していきます!
中にはもう擦られまくって、説明不要な拡張機能もありますので、じっくりは説明しません!
どんなことができるかだけ、簡単にご紹介しようと思います!

※詳しい使い方については、この記事では紹介していませんのであしからず…。


おすすめの拡張機能


Config-Presets


  • ScreenShot

Configプリセット追加・適用画面
適用フィールド設定ファイル
  • 説明

各種の生成設定値をプリセットとして保存することができるようになります。
標準装備の設定値はもちろん、ControlNetなどの拡張機能の設定値なども、保存が可能です。

適用するフィールドは設定ファイルから取捨選択できます。
拡張機能の項目はデフォルトでは無効(コメントアウト)されているので、有効にする場合は、コメントアウト(#)を外して、有効にして使用しましょう!



SD WebUI Tag Autocomplete


  • ScreenShot

動作画面
  • 説明

とても有名な拡張機能ですね。
Danbooruタグを自動補完してくれる機能になります。
あの単語なんだったっけー!というときに、めっちゃ便利な拡張機能です。
さらに、Dynamic Promptsにも対応しており、プロンプト系の他の拡張機能とも親和性が高いです。
まさに神拡張機能です。



ADetailer(After Detailer)


  • ScreenShot

ADetailerパラメータ画面
YOLO検知範囲
ADetailer適用後出力
  • 説明

これもとても有名な拡張機能で、ほぼ説明は不要ですね!
かの有名な物体検知モデルのYOLOで、検知物体の検知座標を抜粋してマスク画像を生成し、局所的にimg2imgにて修復を試みるといった機能になります。
また、ControlNetが導入されている環境では、ControlNetを用いて修復を試みることも可能です。
モデルによって合う合わないがあるので、使いどころは個々で検証が必要ですが、とても便利な拡張機能です!



Tiled Diffusion & VAE


  • ScreenShot

Tiled Diffusionパラメータ画面
  • 説明

もう私が紹介する内容はないくらい、かなり有名になった拡張機能ですね!
どんなものなのかざっくり言うと、「少ないVRAMで本来スペック的に生成できない、大きい画像描画とアップスケーリングができますよ!」と言った機能になります。
また、Tiled機能のその特性を利用してどんなことができるのか、っていう内容は、ぶるぺんさんが事細かに説明しているので、以下記事を見てみてください!



Dynamic Prompts


  • ScreenShot

Wildcard使用例 (1)
*髪色、ヘアスタイル、目の色、服装をランダム化
Wildcard使用例 (1) 生成結果
Wildcard使用例 (2)
*髪色と目の色は3色からランダム選択、ヘアスタイル、服装をランダム化、表情を確率ランダム化
Wildcard使用例 (2) 生成結果
  • 説明

これまた有名な拡張機能です。
生成毎に、Wildcard指定もしくはDynamic Prompt指定した箇所のプロンプトを、ランダム的に変化させる機能になります。
通常は、指定プロンプトが固定で生成されますが、Wildcardを用いれば、Wildcardに登録されている文字列をランダム選出して、プロンプトに割り当てることができます。

このWildcardは、辞書テキストみたいなイメージで、事前に複数の文字列をテキストに入力、Dynamic PromptsのWildcardフォルダ保存しておけば、ファイル名を指定することで効力を発揮します。

Dynamic Promptsの詳しい使い方は、キレネさんが紹介されているので、そちらを参考にしてみてください。



System Info


  • ScreenShot

System Info画面
  • 説明

System Infoは、SD WebUIの現在の動作状況や動作環境を表示する為の機能です。
生成ベンチマークテストも備わっており、グラボ交換などのハードウェア変更や、最適化項目を変更してどの程度変わったか、なども測定することができます。

私の使用方法としては、生成ベンチマークもそうですが、主にトラブルに見舞われた際のトラブルシューティングや、PCの環境変更に伴う正常性確認に使用しています。
現在何のモデルがロードされているのか、CUDAはSD WebUI上でActiveになっているのか等、SD WebUIのローディング状況の確認に役立ちます。



sd-webui-bilingual-localization


  • ScreenShot

適用されてる一例
  • 説明

多言語に対応させるための拡張機能です。
通常、SD WebUIのインターフェースは、英語が基準ですが、これを導入することで複数言語を並べて表示することが可能になります。

ただ、単体では機能せず、翻訳ファイルが必要となるので、日本語を適用する場合は次の拡張機能も併せて導入してください。


SD web UI 日本語化プロジェクト


  • 説明

SD WebUI日本語翻訳用言語ファイルです。
sd-webui-bilingual-localizationと併せて使用します。



ControlNet


  • ScreenShot

ControlNet OpenPose使用例
  • 説明

言わずも知れた神拡張機能のControlNetです。
使用方法や説明に関しては、擦られに擦られまくっていて、もはや説明不要ですね。

簡単に説明すると、様々な付加機能(Control Type)からControlNetモデルを用いて、txt2imgをする際に情報を生成プロセスに割り込ませて、目的の構図を得たり、描画を高精細化したりすることができる代物です。

使用方法については、株式会社taziku様の記事が用途別に記載されていて分かりやすいので、そちらを参照ください。



Free U


  • ScreenShot

FreeUパラメータ画面
FreeU未使用
FreeU使用
  • 説明

FreeUとは、要は高周波情報(ノイズ予測の妨げになりうる情報)を減らし、低周波情報(ノイズ除去の手助けをする情報)を増やして高画質化させようっていう技術です。

今まであった高画質化に関する技術とは、また違った視点からアプローチした技術です。

難しいことはわからん!って方も安心してください。
しっかり、推奨設定がプリセットで搭載されていますよ!
基本的にはそれを使えばいいんじゃないかなーって思います。



sd-webui-prompt-history


  • ScreenShot

Prompt History画面
  • 説明

生成した情報を履歴管理できる、ここ最近の一番の神拡張機能です。
いちいち、PNG情報を表示して割り当てなくても、ここから履歴を選択してプロンプトや設定類を呼び戻すことができます。

めちゃくちゃ便利なので、是非これは皆さんに使って頂きたい拡張機能です。



Super Merger


  • ScreenShot

Super Merger画面
  • 説明

これももはや手放せない神拡張機能の一つです。
モデルのマージやLoRAのマージ、モデルデータの分析などができます。

私はご存じの通り、マージモデルを作ったりしているので、擦り減るくらい多用してます。

使用方法などについては、以下の記事を参考にしてみてください。



Dreambooth


  • ScreenShot

  • 説明

追加学習手法の一つである、DreamboothをWebUIに組み込んだ拡張機能です。
追加学習中はかなりの時間を取られるので、私自身、使用頻度はあまり多くないですが、極々たまーに使ったりしていました。

数多くある追加学習もUI化してきていて、最近では敷居が下がってきたと感じています。
是非、皆さんもモデル製作始めてみませんか!



sd_lama_cleaner


  • ScreenShot

sd_lama_cleaner画面
  • 説明

Lama cleanerをSD WebUI上から起動できるようにしたよ!
という、痒いところに手が届いた拡張機能です。

Lama cleanerをわざわざ1から環境構築する必要もないですし、導入も簡単ですし、呼び出すのもSD WebUI上からできるという、願ったり叶ったりの拡張機能です!



Easy Generate Forever


  • ScreenShot

拡張機能適用例
  • 概要

我らがぶるぺん神が、ご創造なされた神拡張機能です。

何と言っても、無限生成開始と停止を1クリックで出来てしまうという…
導入前までは、右クリックから「Generate Forever」を選択していましたが、その手間が要らなくなる痒いところに手が届きまくりの拡張機能です。

この神拡張機能を作られた、ぶるぺんさんの拡張機能についてはこちらから。



embedding-merge


  • ScreenShot

Embedding Merge画面
  • 概要

この拡張機能は、複数のEmbeddingを重みづけやベクトル演算を用いて、マージする機能になります。
要は、異なるキャプションの概念をマージして、1つの概念としてトークン化してくれます。

私も使用頻度は多くありませんが、目的の生成ができないときなどに、概念の追加的な意味合いで使えるので、痒いところに手が届きます。

使用方法は慣れないとちょっと難儀しますが、使い始めるとあらびっくり!的な拡張機能です。



Model Toolkit


  • ScreenShot

Model Toolkit画面
  • 概要

この拡張子は、破損モデルの修復や各モジュールの抽出・結合を可能にした神拡張機能です。
モデル製作をしていると、破損モデルに出くわすことがあります。
その破損モデルを修復したり、Baked VAEモデルでマージされているVAEがいらない!といった時に、とても役立ちます。

別モデルのCLIPモジュールのみを他のモジュールに移植する、なんていうお遊びもできます。
やる意味はありませんが…



Rembg


  • ScreenShot

Rembg画面
Rembg適用前
Rembg適用後
  • 概要

背景を透過処理する拡張機能です。
導入すると、Extras(その他)タブ内の機能に追加されます。

背景の大まかな透過が容易にできるので、何か画像素材を作る際などは重宝しています。


Tokenizer


  • ScreenShot

Tokenizer画面
  • 概要

文字列のトークンを分析して表示します。
その逆も可能です。(トークンから文字列を分析する)

今ではあまり意識しなくなりましたが、少し前までは75トークン制限が意識されていました。
詳細は、佐城郎画さんのnoteをご覧ください。

スクリーンショット画像を見てもわかりますが、1単語=1トークンは必ずしも方程式として成り立ちません。
wakameは「wak」と「ame」で2トークン有しています。
75トークンを判別する為に、この拡張機能を使用していた方も多いと思います。

現在、私は夏の自由研究的な、指の崩壊に関する研究を細々とやっていますので、その調査の一環である文字列とトークンの分析に使っています。

普段使いでは使用することが無くなりましたが、「いや!トークンを調べて、〇〇に使う!」的なニッチな方にはお勧めです!



Maji Merger


  • ScreenShot

Maji Merger画面
  • 概要

だだっこぱんださん製のモデルマージ拡張機能です。
SD1.xやSD2.x、SDXL、VAEのマージが可能になります。

Super Mergerよりは機能は少ないですが、VAEのマージができるのがこの拡張機能の強みです。
もちろん、階層マージも実装されています。
元々はVAE Mergerとしてリリースされておりましたが、Checkpointマージ機能も追加して統廃合されたようです。



おわりに


いかがでしたか?
今回は、私が使用している拡張機能をご紹介しました!
結構有名な拡張機能が多くて、新鮮味がないかなーとも思ったりましたが、皆さんは新しい発見ありましたでしょうか。

皆さんのお役に立てれば嬉しいです!

拡張機能を追加して、楽しい画像生成ライフを!


この記事が参加している募集

AIとやってみた

よろしければサポートお願いします!✨ 頂いたサポート費用は活動費(電気代や設備費用)に使わさせて頂きます!✨