見出し画像

StableDiffusion3をローカルで3分くらい使ってみた感想

今回は短いです。

先日(日本時間で6/13?)に公開されたStable Diffusion 3の公開モデルをComfyUIで使用して、「テキストも出せるようになりました」がホントかどうか検証してみた。

ヘッダーから見ても分かる通り、結論からして「英語っぽいものなら出る」って感じ。日本語(漢字含む)は全くダメです。ゴミみたいな結果だった。以下は "Superdry 極度乾燥(しなさい)" と "地底人" を書かせようとしてみた結果。

Superdry 英語は出ているが日本語は全く描かれない。
謎のキャラクターがいる。下のテキストは理解不能。
地底人と書かせたかったが謎の漢字が出ている。

自然言語からの生成が上手くなっているということだけど、それ自体が英語で指定しなければならないので英語さっぱりな人間にはかなり使いにくいかもしれない。まだまだ1.5系が使われ続けるのは変わらなそう。

余談ですがStable Diffusion WebUI(Automatic1111)にForgeの機能が拡張機能として提供される方向になると決まったようです。
Forgeの内部処理までそのまま拡張機能として反映できるのか?それとも組み込む形になるのか?ってのはまだわからないけど、どうなるかな。

この記事が気に入ったらサポートをしてみませんか?