見出し画像

【SDXL】 Refinner ってなに? それって必要?

はじめに

こんにちは、kimamanaDr です。

今回は、私がSDXLを使い始めて最初に感じた疑問について紹介します。

この記事では、男女のイチャラブな画像が続きます。書き手の願望も半分ありますが、主にキャラクターの表情や肌の質感に注目する題材として取り上げます。

Refiner の実装

2023年7月にSDXLがリリースされ、その際に大きく注目されたのが Refiner の実装です。

AI画像生成はノイズから少しずつ絵を生成していきますが、Baseモデルが絵の基本部分を担当し、Refinerモデルが仕上げを担当することで、クオリティが向上します。

SDXLの仕組み
出典:Hugging Face stabilityai ページ

SDXLでは、Base モデル から Refiner モデルに切り替えるタイミングを指定することできます。

webUI Fourge の Refinerの設定画面
Stable Diffusion webUI Forge の例

図では 0.8 に設定していますが、この場合は前半80%を Base モデルが、残りの 20% を Refiner モデルが担当します。

Refiner って必要?

Refinerについて調べてみたところほとんど情報がなく、見つけた記事の多くは「使っても効果が薄く、生成速度が落ちるので必要ない」としていました。

そこで、自分でRefinerの効果を実際に調べてみました。

Refinerは公式のベースモデルしか見つからず、カスタマイズの例もほとんどありませんでした。今回はそのベースモデルを使って、Refinerの効果を検証します。

Refiner で描いてみた

まずは Refiner を使って絵を描いてみました。使用したプロンプトはすべて共通で、記事の最後に記載します。

Refiner はもともと描画を想定していないためか、まともな絵ができる確率は1割程度で、指や顔の奇形も多いです。

しかし、うまく描けた絵には独特で素朴な味わいがあります。

Refiner の絵2

近景と遠景

Refiner の絵にははっきりとした特徴があります。最も重要なのは、人物と背景が明確に分かれている 点です。

人物(近景)

  • 輪郭がはっきり

  • 色数が少ない:光の当たる部分、中間、影 の3段階ぐらい

  • 境界線は細い

背景(遠景)

  • 全体にぼかしがかかっている

  • 若干暗い?

人間の視野は注視しているものにピントを合わせ、それ以外の入力を無視するように脳が処理しています。Refiner にも同じような効果があるようです。

丁度良い比率は?

次に、Base と Refiner の最適な比率を探してみます。Refiner は構造に弱いので、前半はホラー画像になってしまっています。

Base 0% Refiner 100%

摩天楼の屋上の若いカップルの絵、作画に失敗して崩壊している

Base 20% Refiner 80%

摩天楼の屋上の若いカップルの絵、同じく作画に失敗して崩壊している

Base 40 %, Refiner 60%

摩天楼の屋上の若いカップルの絵、まだ作画に失敗して崩壊している

Base 60 %, Refiner 40 %

摩天楼の屋上の若いカップルの絵、作画が中途半端でアニメ調

Base 80%, Refiner 20%

摩天楼の屋上の若いカップルの絵、かなりまとも

Base 100%, Refiner 0%

摩天楼の屋上の若いカップルの絵、きれい

やはり後半の80%以降が良さそうです。今回使用した Base モデルの anima_Pencil-XL_v500 はクオリティが非常に高く、100%で全く問題ありません。

注意すべき点は Refiner はやはり描画が苦手なので、Base が描き上げるまで十分に Step を増やす必要があります。実際のところは途中で切り替えるのではなく、描き終えてから Refiner 追加する イメージです。

今度は、逆に Refiner を少しずつ効かしていきます。

Base 100%, Refiner 0%

摩天楼の屋上の若いカップルの絵、きれい
肌がサラサラ

Base 95%, Refiner 5%

摩天楼の屋上の若いカップルの絵、きれい
少ししっとり

Base 90%, Refiner 10%

摩天楼の屋上の若いカップルの絵、きれい
奥行きが増してきた

Base 85%, Refiner 15%

摩天楼の屋上の若いカップルの絵、きれい
背景に重みが出てきた

Base 80%, Refiner 20%

摩天楼の屋上の若いカップルの絵、きれい
表情が崩れてきた?

こちらは好みが分かれそうです。

anima_Pencil-XL_v500 は肌の質感が素晴らしいです。Refiner をかけると潤いが増す感じがしますが、効きすぎるとツルツルのアンドロイドのようになります。

表情については完全にマイナスで、強くかけると繊細さが失われます。

背景は少し Refiner が効いたほうが良く、水彩画で塗り重ねたような厚みが出ます。実際にこのモデルは水彩画から学習しているのかもしれません。

個人的には、線を太くすること無く人物と背景を分けられる 点が一番のメリットだと思います。

結論:基本はいらない

Refiner にはデメリットが多いです。一番のデメリットは、モデルの制作者が苦心して作り上げたバランスを崩すことです。

絵の生成速度も遅くなるので、普段使いには必要ないと思います。

一方で、自分のオリジナリティを加えたい場合は、少し使っても良いかもしれません。

自分は肌の質感と背景の重厚感が好きなので、0.8 ~ 0.9 ぐらいで使っています。

以上、Refinerについてでした。


参考:生成AIでの遠近法

画像生成AIでの遠近法はこちらの記事が参考になります。


今回使用したモデルと制作者のぶるぺんさん


おまけ

使用したプロンプト

ストーリーはキーワードを指定して、Chat GPT に書いてもらいました。

キーワード:摩天楼、屋上、宝石ような夜景、カップル

プロンプト

Standing on the rooftop of a skyscraper, the sprawling nightscape sparkled like an overturned jewelry box. Countless lights twinkled, and the rhythm of the city could be felt, blending silence with vibrancy in a curious harmony.

A couple stood close together on the rooftop. Lisa, mesmerized by the breathtaking view, glanced at her partner, Ken, and saw that he was equally captivated by the dazzling scene.

"It's amazing, isn't it? I've never seen anything like this," Lisa said, smiling.

Ken squeezed Lisa's hand gently and nodded. "Yeah, it's like jewels in the sky."

Hand in hand, they gazed out over the cityscape from the rooftop. The illuminated bridge in the distance, the high-rise buildings lining the river, all glowed against the night sky, while a gentle breeze whispered between them.

Lisa leaned in slightly, resting her head on Ken's shoulder. "I'm glad we came here. Seeing this with you makes me so happy."

Ken smiled at her words and wrapped his arm around her shoulders. "Me too, Lisa. I want to keep sharing moments like this with you forever."

That night, on the rooftop of the skyscraper, with the jewel-like nightscape as their backdrop, their hearts grew even closer. Away from the hustle and bustle of the city, they pledged their eternal love and looked forward to a future filled with hope.

eyes open, light smile, elegant, mature, stylish, original anime character, upper body, aesthetic, vivid, colorful, masterpiece,best quality,4K ultra HD, HDR

ネガティブプロンプト

(big breasts:0.5), low quality, bad anatomy, jpeg artifacts,username, artist name,text,letter,letters,word,watermark,signature,english commentary,thick lips,masculine,fisheye,expressionless,impressionism,contemporary,fog,muted color,blurry,bokeh,backlighting

翻訳をそのままプロンプトに投入しています。ちゃんと理解して描いてくれます。

質問:モデル anima_pencil は幼女向けですか?

そんなことありません。大人もしっかり描けます。


【SDXL】次の記事


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?