はじめに
ローカルで利用可能なFLUX.1の中位モデルの量子化版 dev-bnb-nf4と、下位モデルの軽量版schnell-fp8との比較 を行いました。
下記のセットアップで比較を行っています。(モデルのみを入れ替えているので、それぞれのモデルに最適なノードになっていないかもしれません)
パフォーマンス比較
まず、速度比較ですが、メインの推論ステップに入る前にdev-bnb-nf4は40秒程度かかります。一方、schnell-fp8は(システムメモリ32GBが足りず)スワップしてしまうため、2-3分必要です。
正味の12ステップを終了する時間は、dev-bnb-nf4は47秒、schnell-fp8は60秒必要でした。
生成画像比較
まとめ
今回の比較ではdev-bnb-nf4版の方が、パフォーマンスと画質共に大きく勝る結果になりました。
商用不可dev版、商用可能schnell版は思ったよりも差があるのですね。
※ dev版のライセンスは
とあるので、商用不可と言っても、(モデルでなく)生成した画像の商用利用はOKなのかもしれません。
以下、関連記事の【PR】です。