はじめに
Stable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。
結果
960x1280解像度画像を生成するのに、一枚あたり31秒程度でした。
まとめ
(典型的な画像生成AIの弱点は何も変化がないため)良くもなく、悪くもないという印象です。ただし、モデルが大きいため、システムメモリ 32GB だと少し厳しいので、デメリットの方が大きいかもしれません。
推論中に利用されるGPUメモリは vae 利用時に 9GB 程度、ステップ処理中は 5GB 程度でした。(960x1280解像度、lowvram mode)
ただし、リアル系の画像場合は次の理由があるので、リアルさがモデルの善し悪しの判断にはならない事に注意が必要です。