見出し画像

【覚書】正則化画像ってなぁに?

LoRA作成するときに出てくる「正則化画像」というワード

「正則化画像」とは?

正則化画像」とは、「LoRA学習をかく乱させるための妨害情報」みたいなものです。上の例では、「girl」とキャプション付けられた別人女性の画像を大量に用意することによって、「girl」が特定の女性にならないようにします。

https://hoshikat.hatenablog.com/entry/2023/06/07/215433

つまりはひとつのコンセプトに対して
特定画像で固定されるのを防ごう!!!というもの
防ぐためには同コンセプトで別の画像を大量に入れて
多種多様にしちゃおうぜ!ってことですね

えーっ、そうなるとLoRAの意味って・・・・

(例)
「girl」を「アイリちゃん」で上書き

学習後は「girl」でアイリちゃんが出るようになる

それは困る・・・

「girl」を正則化画像として学習することで
「girl」本来の意味を残す

(「でも、これではLoRA学習の意味がないのでは・・・?特定のコンセプトを学習させるためにLoRA学習をさせるので・・・。正則化画像は数百枚必要となれば、それはモデル(checkpoint)が学習しているのでは・・・。むむむ・・・。」と個人的には考えました。)

しかし、LoRA学習において、kohya-ss氏のSD‐SCRIPTSには、
「特定のキャラクターが出てくればOKであれば、正則化画像を用いなくてもよい」と記載があります!
ある特定のキャラのLoRAをつくりたい場合は正則化画像は不要のようです。

LoRAやDreamBoothで特定のキャラだけ出てくればよい場合は、正則化画像を用いなくても良いといえます。

https://github.com/kohya-ss/sd-scripts/blob/main/docs/train_README-ja.md


この記事が気に入ったらサポートをしてみませんか?