SDXL1.0公開!世界で一番簡単な説明!と使い方!と例!
タイトルは釣りです
日本時間の7月27日早朝、Stable Diffusion の新バージョン SDXL 1.0 が正式リリースされました
この記事では、SDXL とは何か、何ができるのか、使ったほうがいいのか、そもそも使えるのかとかそういうアレを説明したりしなかったりします
正式リリース前の SDXL 0.9 の記事にも作例などあります
SDXL って何?
SDXL とは、Stable Diffusion の第3世代(でありベースモデルのこと)です
Stable Diffusion を使った画像生成するときにモデルとかいうものを選択しますが、それらは多分ほぼ全てベースモデルから派生したものです
今回、それの新しいヤツが出たってことですね
Stable Diffusion は2023年7月現在、大きく以下の3バージョンに分けられます
第1世代 Stable Diffusion v1 ( SD1.4 / SD1.5 )
第2世代 Stable Diffusion v2 ( SD2.0 / SD2.1 )
第3世代 Stable Diffusion XL ( SDXL0.9 / SDXL1.0 )
これらの世代の違いはゲームハードに例えるのが一番しっくりきました(刈宮さんが言ってた)
SDv1 が PS3、SDXL が PS4 みたいなイメージです(SDv2は…)
やれること(画像生成)は変わらないけど表現力が上がる!みたいな
そして、世代が変わると周辺機器(モデルとかLoRA とか一部の拡張機能とか)の互換性が基本なくなります
使えるようにするにはリメイクしたり、対応したりが必要って感じですね
ちなみに最も普及しているのは Stable Diffusion v1 です
自分が何を使っているかよくわからないという方は、99割 SDv1 系を使っていると思ってよいです
SDXL になったら何が変わるの?
基本性能が凄く上がる!(プロンプトの理解度とか?)
まあよくわからんけどなんかすごいってことです
でも上がるのは基本性能だけなので、チューニングをしないと今主流のイラストやフォトモデルと同じようなものは生成できません!
なので今すぐに移行できるというわけではないことに注意してください
今、主流のモデルたちも SDv1 がリリース(2022年8月)されて1年近く改良が繰り返されてきた結果なので、SDXL もチューニングされることを気長に期待して待ちましょう
SDv1 系で有名なモデル製作者の方々の中にも SDXL に移行することを表明されている方がわりといらっしゃいます!期待大!
どうやって使えばいいの?
stable-diffusion-webui を使っている場合は、最新版(1.5.0以降)にアップデートをすることで使えるようになります
使い方は今までと特に変わらず、モデルをダウンロードしてモデルフォルダに放り込んで選択するだけ!
ただし、モデル自体のサイズが大きい(最小で7GBぐらい)のと生成画像のサイズもある程度大きくする必要があるのでPCスペックは結構必要です
(RTX 20XXシリーズ以上推奨ってどっかでみた)
実際に使ってみよう
SDXL1.0 のベースモデルは HuggingFace からダウンロードできます
(ライセンスも正式リリースに合わせて CreativeML Open RAIL++-M License に変更されました)
このモデルを選択して適当に生成してみます!
(refiner というのもありますが無くてもいいのでこの記事では触れません)
ただし、ベースモデルは汎用的な画像を生成できるよう作られているため、画像のスタイルも含めプロンプトで指定する必要があることに気を付けてください
(指定がないと対象物の属性に強くひっぱられます)
以下、全て同じ設定で生成します!
生成画像サイズ:1024x1024
サンプリングアルゴリズム: DPM++ SDE Karras
サンプリングステップ: 20
CFGスケール: 7.5
ネガティブプロンプト: なし
VAE:なし
プロンプトは基本的には適当に文章を翻訳していれとけば大体なんとかなります
写真風
先頭に photo of とかつけとけば大体写真っぽくなります
イラスト風
同様に illustration of とかそういうのつければイラストになりやすいです
イラストといってもいろいろあるので自分が望むスタイルをちゃんと指定しないといけません
文字を出す
SDXL の大きな特徴として指定した文字を出しやすくなりました
(まだまだ打率は低いけど)
ほかにもいろいろ
面白い使い方はまだまだいっぱいあると思うので色々作ってみてください!
で、結局使ったほうがいいの?
現時点ではおもちゃとして遊ぶぐらいがちょうどいい!
おまけ
SDXLベースモデルでいい感じのものを生成するコツ
基本的にSDv1初期~中期に用いられていたプロンプトがかなり有効です
ちょっと古め(2022年末~2023年2月ぐらい)のプロンプトを探してきて入力してみるとヨシ!
遊びで使う分には、海外有名アーティストや有名なゲームタイトルを入れてみると分かりやすく影響が出るのでおススメです
ちょっと試してみたいけど環境を用意できない人は!
以下の公式サイトで生成することが出来ます
(無料だと1日400枚まで / 生成画像の右下にウォーターマークが付きます)
また、弊 Discord サーバーでも Bot として動かしていて誰でも使えるようにしてあります(全部丸見えだから他の人の作例も見れます!)
ちょっと深いところで SDXL のプロンプト研究もやってたりします
SDXL系モデルの作例
以下、過去にSDXL系列のモデルで作った画像を垂れ流しておきます
SDXL サイコー!
おまけのおまけ
最後にさらなるおまけとして、あの有名な女性のちょっとセクシーな画像とプロンプトを貼っておきます
見たい方は☟からリツイートしていただけると幸いです
(SNSプロモーション機能を使ってみたかっただけのネタなので全く期待しないでください)
ここから先は
この記事が気に入ったらサポートをしてみませんか?