見出し画像

コピー機学習法でLoRAを作ってみる~丸メガネを差分学習で生成

 LoRA作成で使われているコピー機学習法=差分学習法を試したくなりました。
 コピー機学習法とは、LoRA作成で使うベースモデルに特定の「絵柄」を強烈に学習させたうえで、その絵柄との「差分」を学習させる方法。
 LoRAの「学習のベースモデルとの違いを学習してファイルにまとめる」という仕組みを最大限有効活用する仕組みとなっています。

具体的な手順は


  1. 1枚の絵=Aを過学習したLoRAを作る。

  2. LORAをモデルにマージする。

  3. 「A」に変化を加えたBを作成する。

  4. 「2」で作ったモデルをベースにし、「B」を素材にしてLoRAを作る。

  5. 差分LoRA完成


 詳しい説明は「LoRA コピー機学習」で検索してもらえば、詳しい解説サイトがいくつか見つかるはずです。

 で、このエントリでは、詳しい説明ではなく実際にコピー機学習を行ったときの学びなどを書いていこうと思います。

 今回は「丸メガネLoRA」を作ってみます。

1:1枚絵LoRAを作る。

 まずは1枚絵を強烈に学習させます。
 AdamWで学習率1e-3にしてCosineでガっとやれば大丈夫。

適当に顔を出力。もっとデフォルメ効いたシンプルな絵でもいいかも?
メガネの邪魔にならないように髪型は短くシンプルに。

2:マージしてコピー機を作る

 1で作ったLoRAをSuperMerger使って適当なモデルとマージ。
 モデルはなんでもOK。普段よくつかってるやつとか。

3:元絵を変更
 1で使った絵をベースにして、変更したい要素を追加。
 今回はメガネを追加。

元の絵にメガネ追加。色やディテールはお好みで。
これはメガネの商品写真を探してきて、コピペで合成&細部修正。

4:差分LoRA学習
 2のモデルをベースにして、3で作った絵を学習して完成。
 パラメータは1と同じで、うまくいかないときは数値を適宜調整。
 基本的には強め学習でOK。


 丸メガネLORAですが、素材1枚でそこそこちゃんとメガネが出るLoRAはできました。
 ただ、丸い感じにはなるけど真円にはならない…みたいな感じでした。

 そもそも、プロンプトでもメガネは簡単にでるためLORAの必要性は低いといえます。
 いっぽうで、LoRAを使うとプロンプトで出すよりも、形状の傾向をコントロールしやすいうえに出力も安定するので、LORAを作る価値はなくはないです。
 「素材1枚でOK」「素材が少ないから学習時間が短い」など、メリットも多いので、やり方を覚えておいて損はないと思います。


 以下、学習時に使用したコマンド&パラメータと、その解説。およびサンプルで作った丸メガネLoRAのバリエーションを、有料部分で公開します。
 いつものように「他人がLoRAを作っているときのパラメータを知りたい」とか「時間をかけて学習するのが面倒くさい」方向けとなっています。
 またメガネLoRAは、狙った形状が出たり出なかったりです。狙った形状を必ずだせるわけではありません。「丸メガネ」で綺麗な丸がでるのは珍しいです(丸っぽいのはまぁまぁ出ます)。
 そのあたりの諸々をご了承のうえ購入して頂けると嬉しいです。

・コピー機モデルにマージするLORA作成用のコマンド。
・コピー機モデルで差分学習するときのLORA用コマンド。
・差分学習で作成したメガネLoRA。
(丸メガネ(赤・黒)、四角メガネ2種、その他)
・差分作成に使った元画像&差分画像12枚(近日追加)

メガネLORAサンプル画像(主にsukumiz mix。一部オリジナルマージ)

赤い丸。かなり綺麗に出た部類。
こちらも赤丸LORA使用。上が直線気味になって楕円に。
このパターンがけっこう多め。
黒丸。これはかなり丸い方。
リムレス画像を学習したスクウェアメガネ。
リムレスは希に出る程度。あと形状が太くなりがち。
リムレスLORAを髪型LORAと併用した図。
なぜかメガネの再現性が上がったりする。奥が深い。
赤い四角リムレス学習。形状は出やすい方。リムレスは運。
メガネの場合、黒より赤の方が学習しやすい印象。
赤四角リムレス。
リムレスになりやすいモデルとなりにくいモデルがある。
金色フレーム

ここから先は

6,152字 / 3画像 / 10ファイル

¥ 300

この記事が気に入ったらサポートをしてみませんか?