見出し画像

【AI】美女の顔を作りまくろう!Hires.fixのおすすめのやり方 【stable diffusion webui】

txt2imgで生成

リアル系のt2iのHires.fixのおすすめのやり方です。(今のぼくのやり方)

1.civitaiかちちぷいで優良プロンプトをディグる

適当にcivitaiかちちぷいで優良プロンプトをディグ(掘る)ります。リアル系の公開者が多くて見つけやすいからですね。

ちちぷい(呪文あり、AIフォト)

例 : https://www.chichi-pui.com/posts/09d87f2b-5bc2-41d5-b079-b6ba48fc0faf/

civitaiの場合は良さげなモデルとかLoraの作例に書かれています。

例 : https://civitai.com/gallery/130877?reviewId=18419&infinite=false&returnUrl=%2Fmodels%2F10519%2Fchinese-cosplayer-xiaorouseeu-cosplayer-seeu

noteやFanBoxでもたまに公開されてます。

例 : https://note.com/code_wizardry/n/n9c48006e27c9


2.好きな顔ローラをプロンプトに含める

civitaiで画面右上のフィルターからLoraを選んでそこから探します。
#photography を選択するとさらに見つけやすくなります。

顔Loraは0.1~0.3とか弱くかけるのがコツ。強くかけると歪みます。

LoRAとモデルは別物です。LoRAは出てすぐ消えることが多いのでおすすめはその時々で在るものを使わせていただくか、DLして使います。消えるというのは公開者様が非公開にするということです。

モデルは無くなりにくいけど、まれになくなったりします。今おすすめのモデルは MUSE_v1 です。MUSE_v1 はすでにVAEが焼きこんであるのでVAEがいりません。

3.t2iでRestore facesをonにして長辺が768px以上で生成

t2iで生成します。リアル系の場合はモデルによりけりですがRestore facesをonにします。offのままの方がいいモデルであればoffです。

サンプラーとかCFGスケールとかはお好みで。わからなければデフォでOK。
seedは-1でランダムです。
画像サイズは512px*512px以上でOK。例 : 512px*1024px。512px*768px。
長辺が768px以上の方がいい気がします。

Restore faces(顔修復)にチェックを入れる

良い構図が出るまで何度も生成を繰り返します。

構図というのはポーズと、光の加減と、顔の向きと、全体的な印象と、全体的なテーマと、四肢のバグのなさと、顔のバグのなさと、服装と、髪型と、背景と、、、、と全体的にいいなと思えるのに出会うまで何度も生成をする感じです。もし、時短を試したければこの段階でコントロールネットも使います。

満足するいい構図ができましたら1段階目終了です。2段階目に入ります。

4.欲しい絵が出たらHires.fixをonにして今のシードを適用して生成

Hires.fixにチェックしてシード欄のリサイクルマークを押して、今のシードを適用します。

Hires.fixにチェックして、シード欄の横のリサイクルマーク♻️を押して今のシードを適用します。

Denoising strength(以後Ds)を変えて生成してバリエーションを出して選びます。顔がぐちゃっててもDsを変えれば綺麗になることがあります。

Dsはi2iのと同じ効き方をします。つまり、0に近いほど元の絵の特徴をそのまま残します。1に近いほど大きく変わります。

Upscalerは、ぼくは ESRGAN_4x を使用しています。
Hires steps はデフォ(0)のまま。
Upscale by は 2 で2倍になります。例:512:768でUp後に1024:1536



Extrasで拡大

t2iのHires.fixで拡大するのはきれいな顔が出やすいからですが、Hires.fixをすると顔が変わってしまうので使いたくない場合があります。

512px*768pxなどでいきなり高クオリティのものが出た場合、Hires.fixを使わずにExtrasタブに移動してアップスケールしています。この場合は顔が変わりにくいです。(使うアップスケーラーによりますが)

本当に変えたくないときは SwinIR 4xを使い、
詳細の復元目的なら ESRGAN_4x を使います。(他のはためしたことないため。)

GFPGAN visibility は 1で顔復元がmaxにかかると思います。

追記:単純な拡大をしたい時にはアップスケーラー(専用ソフト)で拡大すると便利です。おすすめはKohya S.さんのPixSr4xです。アニメ用ですがリアル系でも十分実用的です。Extrasと使い分けます。

https://twitter.com/kohya_ss/status/1549739020678180865

img2img

新たにページを割くのもあれなんでここに書きます。

ぼくはi2iでアップスケールはしないので小ネタはこれしかわかりません。


i2iをするときに Just resize (latent upscale) を選んでおけば同時に少し綺麗にしてくれます。


番外編

txt2imgで普通サイズの画像を生成してHires.fixして拡大した大きな画像を作るのが普通の使い方だとすると、さらに小さい画像を作ってそれをHires.fixをして普通のサイズにする方法もあります。

例:画像サイズを 512px : 768px で生成して構図チェックしてからHires.fixにチェックを入れて 1024px : 1536pxで生成するのではなくて
画像サイズを 256px : 384px にして初めからHires.fixにチェックを入れて 512px : 768pxを生成します。それで構図チェックをしていいのをさらにアップスケールします。ハイレゾ化を2回するので絵柄が変わりますが、より洗練される方向に変わる気がします。この使い方もおすすめ。


最後に

良い顔は Hires.fix でできる感じではなくて、LoRAでできると思います。LoRAの研究をしましょう。

Hires.fix は小さい画像を大きく拡大するときにAIの力を使っていい感じにしてくれる機能だと思います。特に詳細の復元ができるのはすごいポイントです。

だから、小さい画像(GPUリソースが少なくて済むから)で構図ガチャをして、コントロールネットを駆使して構図制御をして、良い感じに仕上がった1次アイテムを2次アイテムに拡大復元するという考え方だと思います。

追記: 3段階の手法

レベチのやり方を公開してくれました。中国語で何を言っているかわかりませんのでこの方法で文字起こししたものを付けました。

1. 1段階目の出力でセミリアル(?)っぽいので構図確定して、
2. 2段階目の出力でリアル化しつつ拡大して、
3. 3段階目でステップ150でさらに拡大してシャープな書き込みの完成。

[00:00 - 00:03]皆さん、こんにちは。私は「練単りゅう」と申します。
[00:03 - 00:07]今日は、AIお絵かきツール「Stable Diffusion」の使い方をご紹介します。
[00:07 - 00:09]「Stable Diffusion」を使って、ピンク系水着美女を描きましょう。
[00:09 - 00:12]まずは、「Stable Diffusion」のウェブUIを開きます。
[00:15 - 00:19]Prompt提示欄とNegative Prompt(反対の提示)欄に、私が用意したプリセットのPromptを入力します。
[00:19 - 00:24]モデルは「ChickMix」を使用します。
[00:24 - 00:27]幅を800、高さも800、Samplerを「ULA」、Sampling Statsを50、CFG Scaleを7、ランダムシードを「-1」とします。
[00:29 - 00:41]その後、「生成」ボタンを押して、最初のスケッチの生成を待ちます。
[00:45 - 00:49]しばらくすると、プールにいるピンク色の美女が生成されます。
[00:49 - 00:56]画像が生成されたら、「図生図」ボタンを押して、画面を「図生図」画面に切り替えます。
[00:56 - 00:59]いくつかの細部パラメータを再設定します。
[00:59 - 01:13]幅を1200、高さも1200、Samplerを「ULA」、Sampling Statsを150、CFG Scaleを7、再描画幅を「0.375」、ランダムシードを「-1」とします。
[01:13 - 01:19]「Additional Networks」を開いて、外部ネットワークの「Laura」を追加します。好みに応じて追加してください。
[01:19 - 01:27][01:35 - 01:43]画像が生成されたら、Laura外部プログラムによって元の顔がインフルエンサー風の美女に変身していることがわかります。
[01:43 - 01:54]生成された画像を、Grapherのソースボックスにドラッグ&ドロップしましょう。
[01:54 - 01:58]そして、最後のステップに移ります。モジュールをTrill Of Mixに切り替えます。これは、超解像度フレームを生成するモジュールです。
[02:04 - 02:22]このモジュールを使用すると、ウィズと高さを1320に、サンプラーをURAに、サンプリングスタットを150に、CFGスケールを7に、描画リニューアル度を0.275に設定し、ランダムシードに-1を使用することができます。Laura外部プログラムは変わりません。そして、生成ボタンを押してください。
[02:25 - 02:31]そうすると、非常にリアルなピンクの水着姿の美女があなたのコンピューターに現れます。
[02:31 - 02:41]下のアイコンをクリックすると、Grapherの出力フォルダに移動できます。
[02:41 - 02:44]ここで、今までの作業の成果を確認してみましょう。
[02:44 - 02:49]美しい女性の姿、白く滑らかな肌が見えます。
[02:49 - 02:57]拡大しても、画像の品質はクリアで驚くほど美しく、非常に満足できます。
[02:57 - 03:04]以上が、Stable Diffusionを使用してピンクの水着姿の美女を生成する方法です。
[03:04 - 03:29]あなたのお役に立てることを願っています。

問題解決

プロンプトとブクマ管理問題を解決する

DeepL翻訳 のWindows版がものすごくお勧めです。英語を[ CTRL + c + c ] を押すだけで起動して即時翻訳してくれます。精度も高いです。

それと合わせて、Google スプレッドシート に、
=googletranslate(セル番号,"ja","en")
と入れると翻訳してくれるので、プロンプト一覧を保存しておくのに便利です。(使い方: https://note.com/amatsukarin/n/n42bccbf0305b)

以下のコードでブックマークレットを作るとタイトルとURLをコピーできますので、スプレッドシートに一緒にアーカイブしても便利です。貼り付けオプションの「テキストを列に分割」でカンマで区切れます。

javascript: (function copyToClipboard(text) {var d=document,t=d.URL +" , "+ d.title;return navigator.clipboard.writeText(t)}) ();

ハイレゾ化の問題を解決する

書き込みが増えプロンプトで指定する要素が画面内に増えると、顔や服が崩れます。その時に使える小技がこちらです。Gimpなど画像編集ソフトで切り出してハイレゾ化し、縮小して元の位置に貼り付けます。

サンプル数を上げるのも書き込みが増えるのでおすすめです。

色かぶり問題を解決する

LoRAはキーワードを増やす目的があります。元モデルに学習されていないワードをLoRAという形で付け足してカスタマイズできるようにしたということです。品質の低いLoRAを使うと、それに引っ張られて出力すべての品質が下がります。質の高いLoRAを使って質の低いLoRAを使わなくするか、画像編集ソフトで修正します。

画像編集ソフトはオープンソースの「Rawtherapee」(ロウセラピー)が無料でお勧めです。ホワイトバランスで調べるとスポイトなどの使い方が出ます。が、ちゃんとしたソフトなので、設定できる項目が多くてわからないと思いますが、ホワイトバランスと黒レベルの2項目だけ使えば十分だと思います。

ホワイトバランス調整の例: https://odn-photo.hatenadiary.jp/entry/2017/11/25/004131

起動時に設定済みであってほしい

ui-config.jsonを編集しましょう。デフォルトプロンプトを入れとけばすごく便利です。Colabでも使えます。Colabの左パネルにあるフォルダにファイルをupしてからstable-diffusion-webuiというフォルダに移動します。

ファイルをupしてからstable-diffusion-webuiというフォルダに移動します。

(スタイルを好みに変えれるuser.cssも同様の手順でできます。)


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?