![見出し画像](https://assets.st-note.com/production/uploads/images/103597084/rectangle_large_type_2_a9fcc7756fb82cd1a3a5fe67263d993e.png?width=800)
Photo by
satoshi_st
Lora学習のキャプションとタグの意味
キャプションが何をしているのかについてはちょっと前に書きました。
問題
問題はキャプションを一緒に学習させると言いつつ、タグをつけている人がいることでした。というかほとんどそうです。どういう事? と思ってました。
タグ型のキャプション、文章型のキャプション
Loraの中身を見て謎が解けたのですが、キャプションには文章型とタグ型の2種類があるようです。
文章型のキャプション
![](https://assets.st-note.com/img/1681951714104-MHlzbp1NoZ.png)
タグ型のキャプション
![](https://assets.st-note.com/img/1681951745828-P2hYPZGEBv.png)
キャプションなし
![](https://assets.st-note.com/img/1681951797160-waIb6GNC6G.png)
どちらがいいの?
使い勝手はタグ型キャプションの方がいい気がします。単純に単語を入れたり消したりすれば良いだけなので。
上の図のタグの横に書かれている数字がそのタグが使われた回数です。多い方が強いという事なので、出来上がりの絵見て参考になります。
結局、学習画像が大切
そうは言っても、結局学習画像が同じような画像ばかりだとそれが強く出ます。
キャプションはほんのちょっとだけ手助けしてくれる機能と思っておけばいいです。
この記事が気に入ったらサポートをしてみませんか?