見出し画像

img2imgを高画質化するMultiDiffusion

hires.fixはとても優秀な高解像度化技術ですがimg2imgの時は利用する事が出来ません。

今まではimg2imgは使わずtext2imageを多用してきました。
これから紹介するテクニックを使うことでhires.fixに近い高画質化をimg2imgで使うことができます。

文字だけでは再現できなかったイラストがある方には必見の技となります。

MultiDiffusionを知る

マルチディフュージョンアップスケーラーは、Automatic1111のStable Diffusionモデルを使用して、低解像度の画像を高解像度にアップスケールするツールです。主な特徴は以下の通りです。

  • ESRGANやRealESRGANなどの最新の画像超解像アルゴリズムを使用して画質を向上させます。

  • 複数のディフュージョンモデルを組み合わせることで、より自然なテクスチャとディテールを生成できます。

  • 既存の画像に追加のディテールを付与できる「ディテーリング」モードがあります。

  • 画像に含まれるテキストを拡大し、シャープに保つ「テキストアップスケール」モードがあります。

  • 高速処理が可能で、GPUを活用することでさらにパフォーマンスが向上します。

  • Web UIで簡単に操作でき、使いやすいインターフェースが特徴です。

  • 出力結果を細かく調整するための各種パラメータが用意されています。

簡単に言うと低解像度の画像をきれいに大きくするソフトウェアです。
このソフトウェアには、最新のAI技術が使われていて、画像に含まれるパターンやテクスチャを読み取って、自然な画質で拡大することができます。操作も簡単で、低解像度の画像を読み込ませるだけで、自動的に高画質に拡大してくれます。パラメータを調整すれば、より細かく画質をコントロールすることもできます。

MultiDiffusionを導入する

とても簡単です。いつも通りの拡張機能追加の方法で追加可能です。
「Extensions」から「Install from URL」の「URL for extension’s git repository」に下記のURLを入力してください。インストールが自動で完了します。
automatic1111の再起動をすれば項目が追加されています。
MultiDiffusion項目のTiled DiffusionとTiled VAEが表示されていると思います。

https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111

MultiDiffusionを使用する

img2imgのタブを開き、アップスケールしたい画像を配置しましょう。
今回は以下のイラストを事前に生成して読み込ませました。

Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 2886533051, Size: 544x768, Model hash: cd8732bdc3, Model: ShiratakiMix-add-VAE, Denoising strength: 0.75, ControlNet 0: "Module: lineart_anime, Model: control_v11p_sd15_lineart [43d4be0d], Weight: 0.6, Resize Mode: Crop and Resize, Low Vram: False, Processor Res: 512, Guidance Start: 0.1, Guidance End: 0.6, Pixel Perfect: False, Control Mode: Balanced", TI hashes: "EasyNegative


元画像と同じSampling methodを設定し、CFG Scaleを7、Denoising strengthを0.5にしましょう。Seed値は-1の状態にしましょう。

次にTiled Diffusionのタブに移動します。
Enableにチェックを入れます。
methodをMultiDiffusionにし、UpScalerを好みで変更します。私はR-ESRGAN 4x+ Anime6Bです。
Scale Factorに拡大率を入力します。私は2.5倍から2.7倍辺りを使用します。Keep input image sizeにチェックを入れます。

Tiled VAEのタブを開きます。
EnableMove VAE to GPUにチェックしましょう。

あとはGenerateを押して生成してみましょう。

Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 820312063, Size: 1360x1920, Model hash: cd8732bdc3, Model: ShiratakiMix-add-VAE, Denoising strength: 0.96, Mask blur: 4, ControlNet 0: "Module: lineart_anime, Model: control_v11p_sd15_lineart [43d4be0d], Weight: 0.6, Resize Mode: Crop and Resize, Low Vram: False, Processor Res: 512, Guidance Start: 0.1, Guidance End: 0.6, Pixel Perfect: False, Control Mode: Balanced", TI hashes: "EasyNegative:

このようにimg2imgで高画質化が出来ました。単なるupscaleと異なり部分的に変化が見られます。
これを使えば今まで表現できなかった難しいイラストが生成できますね。

この記事が気に入ったらサポートをしてみませんか?