![見出し画像](https://assets.st-note.com/production/uploads/images/144524441/rectangle_large_type_2_85df33e1357fbc6c42607baa261574ca.png?width=800)
【ComfyUI】stable diffusion3のモデルを導入して、イラストを生成してみた
先日stable diffusion3のモデルが遂に、無料公開されることになりました。
以前紹介したApiを使っての利用ではなくて、完全に無料での公開となります。
また、以前よりも負荷が軽減されて、要求されるPCのスペックも減ったようです。
なので、早速ComfyUIでそのお力を試してみようじゃあありませんか。
ComfyUIをまだお持ちでない方は以下の記事を参考にしていただいて、先に導入をお願いします。
また、拡張機能を簡単に入れる「ComfyUI-Manager」を以下の記事から導入してください。
stable diffusion3の導入
最初にSD3で使うのに必要なモデルなどをダウンロードしましょう。
以下のリンクカードからHuggingFaceに移動しましょう。
いつも通りファイルをダウンロードしようとするとログインをしてくださいというのを求められると思います。
恐らく多くの方が登録されていないと思うので、新規登録を行って一度ログインをします。
![](https://assets.st-note.com/img/1718745046394-wo0EBPH3BZ.png?width=800)
再度開きなおすと以下のようにファイルが表示されます。
![](https://assets.st-note.com/img/1718744443569-BME6c9hXhD.png?width=800)
①モデルのダウンロード
この中から、以下の項目のいずれかをダウンロードしましょう。
ファイルの容量が結構大きいので、時間に余裕があるときにやるのがお勧めです!
今回は「sd3_medium_incl_clips_t5xxlfp16.safetensors」をダウンロードし用と思います。
![](https://assets.st-note.com/img/1718744522056-5nxcse5Y8v.png?width=800)
以下モデルの説明
sd3_medium.safetensors→MMDiTとVAEの重みが含まれていて、テキストエンコーダーは含まない
sd3_medium_incl_clips.safetensors→T5XXLテキストエンコーダー以外のすべての必要な重みが含まれています。
sd3_medium_incl_clips_t5xxlfp16.safetensors→fp16バージョンのT5XXLテキストエンコーダーを含む、すべての必要な重みが含まれています。その分求められるスペックが大きくなります。
sd3_medium_incl_clips_t5xxlfp8.safetensors→fp8バージョンのT5XXLテキストエンコーダーを含む、すべての必要な重みが含まれています。fp16より軽量です。
MMDiT?T5XXLテキストエンコーダー?と思った方もいらっしゃると思います。
以下のサイトで詳しく解説されているので、ご興味がある方はこちらをお読みください。
ダウンロードしたら、modelのフォルダに入れましょう。
②テキストエンコーダーのダウンロード
次にテキストエンコーダーのダウンロードを行います。
上の方に「text_encoders」というフォルダがあるので選択します。
![](https://assets.st-note.com/img/1718748325123-cVqPKJfX9s.png?width=800)
以下のテキストエンコーダーを全てダウンロードします。
![](https://assets.st-note.com/img/1718748373146-onGcFc1xFx.png?width=800)
ダウンロードしたらmodelsの中のclipフォルダにファイルを入れます。
生成してみる
サンプルのワークフローがあるので、そちらを利用してみます。
Hugging Faceのページの上の方にサンプルのワークフローがあるので、そちらのフォルダからサンプルをダウンロードします。
![](https://assets.st-note.com/img/1718748833897-R33hDvzNpg.png?width=800)
それをComfyUI上で展開してみます!
upscaleのワークフローがあったので、そちらから試してみます。
おお、これまであまり使ったことがないノードがありますね。
![](https://assets.st-note.com/img/1718748974557-ogf7bfAvT6.png?width=800)
もしも、ワークフローを入れたときに必要なカスタムノードがない場合には、Managerを開いて、Install Missing Custom Nodesを開いて、必要なカスタムノードをインストールしましょう。
![](https://assets.st-note.com/img/1718749088071-BIIWK3IKMO.png)
![](https://assets.st-note.com/img/1718749103823-GoivQm5mqh.png?width=800)
それでは、最初は特にいじらないでそのまま生成しようと思います。
モデルの項目を「sd3_medium_incl_clips_t5xxlfp16.safetensors」にします。
そのあと、すでにモデルの中にテキストエンコーダーが含まれているので、
TripleCLIPLoaderを消して、CLIPはモデルから引きます。
![](https://assets.st-note.com/img/1718749306008-Eg4AEwUPrS.png?width=800)
![](https://assets.st-note.com/img/1718749282418-MELraYafBd.png?width=800)
すごい綺麗ですね。
![](https://assets.st-note.com/img/1718749539629-cR41YWHsBV.png?width=800)
こうなったら、いつものドット絵を試してみましょう!
どんなのが出てくるのかな?ワクワク!
おお、ちゃんとドット絵ですね!
loraも使っていないので、すごいクオリティです。
![](https://assets.st-note.com/img/1718750585615-4jzkFp42FN.png?width=800)
今度は通常のイラストで出力してみます。
綺麗に描けていますね。
ただ、まだ少し試行錯誤が必要ですね。
![](https://assets.st-note.com/img/1718751085664-3MBm0foLNC.png?width=800)
今度は風景を出してみようと思います。
図書館を出力してみました。
普通にきれいですね!
![](https://assets.st-note.com/img/1718751159820-8ZqM9QLxtD.png?width=800)
そういえば、stable diffusion3で文字が入れられるのを忘れていました。
早速やってみましょう!
すごい!ちゃんと出た。
もしかして、マンガとかも描けたりするのかな…。
![](https://assets.st-note.com/img/1718751719659-l8RKOStP1X.png?width=800)
最後にリアルの人物を描いてみます。
かっこいいですね。夢の中の私のようです。
![](https://assets.st-note.com/img/1718751285602-Umom0Pc9Fz.png?width=800)
やってみた感想
やっぱり大きなバージョン更新は変化が多くて楽しいですね!
全体的に画質も良いので、文字の生成などを試しながら、
SD3を研究をしてみたいと思います。
それでは皆様よき創作ライフを…!
この記事が気に入ったらサポートをしてみませんか?