見出し画像

NovelAI V3における生成画像の高品質化に役立つ画風指定タグの解説

NovelAI Diffusion V3はデフォルト設定では、生成画像の画風や品質を保つのが難しい。しかし、呪文(プロンプト)に適切なタグを追加することで、出力画像の品質向上が可能だ。

本記事ではブルアカキャラを例として、NovelAIにおける品質タグや画風タグの使い方を解説する。


デフォルト設定で生成

まず、NovelAIの初期設定のままで生成した画像が以下。
キャラクターはブルアカの天童アリス。

アリス (品質タグ無し)

ソース:Stable Diffusion XL C1E1DE52 (NAI Diffusion Anime V3)
要求タイプ: Text to Image
プロンプト: {1girl, aris (blue archive), blue archive}, blue eyes, black hair, very long hair, one side up, hairband, white jacket, collared shirt, blue necktie, black pleated skirt, feet out of frame, standing, smile, simple background
除外したい要素: (未入力)
画像サイズ: 832x1216
シード値: 1234567815
ステップ: 28
サンプラー: k_dpmpp_2s_ancestral (native) [SMEA]
プロンプトを反映する正確度: 5
プロンプトを反映する正確度の再調整: 0
除外したい要素の強さ: 1

NAIv3 Metadata

正直、生成された画像の品質はかなり微妙だ。キャラによっては初期設定のままでも上手く出力できる場合もあるが、少なくともアリスの場合はどこかチープ感が漂う。

画風・品質・美的タグを追加して生成

そこで、上記の呪文に画風・品質・美的タグを追加して生成した画像が以下。

アリス (高品質指定)

ソース:Stable Diffusion XL C1E1DE52 (NAI Diffusion Anime V3)
要求タイプ: Text to Image
プロンプト: {1girl, aris (blue archive), blue archive}, [[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}, blue eyes, black hair, very long hair, one side up, hairband, white jacket, collared shirt, blue necktie, black pleated skirt, feet out of frame, standing, smile, simple background, best quality, amazing quality, very aesthetic, absurdres
除外したい要素: worst quality, low quality, bad quality, bad anatomy, bad hands, bad feet, displeasing, unfinished, missing, artistic error, [abstract], lowres, jpeg artifacts, scan, chromatic aberration, signature, username, watermark, text, extra digits, fewer digits, @_@, chibi, nsfw
画像サイズ: 832x1216
シード値: 1234567815
ステップ: 28
サンプラー: k_dpmpp_2s_ancestral (native) [SMEA]
プロンプトを反映する正確度: 5
プロンプトを反映する正確度の再調整: 0
除外したい要素の強さ: 1

NAIv3 Metadata

先程に比べて、明らかに描写力や質感が向上しているのが分かる。
※太字の箇所が追加したタグ。

追加した呪文の詳しい内容は後述するが、大雑把に言うとプロンプトに「神絵師たちが描いた高品質で上手い絵を参考にしろ。低品質で下手な絵は参考にするな」という意味だ。

さらに以下の画像は、上記画像のポジティブ命令とネガティブ命令を入れ替えて生成したものである。つまり、「低品質で下手な絵を参考にしろ。神絵師たちが描いた高品質で上手い絵は参考にするな」という注文を出している。

アリス (低品質指定)

ソース:Stable Diffusion XL C1E1DE52 (NAI Diffusion Anime V3)
要求タイプ: Text to Image
簡易版
未加工のパラメーター
プロンプト: {1girl, aris (blue archive), blue archive}, blue eyes, black hair, very long hair, one side up, hairband, white jacket, collared shirt, blue necktie, black pleated skirt, feet out of frame, standing, smile, simple background, worst quality, low quality, bad quality, bad anatomy, bad hands, bad feet, displeasing, unfinished, missing, artistic error, [abstract], lowres, jpeg artifacts, scan, chromatic aberration, signature, username, watermark, text, extra digits, fewer digits, @_@, chibi, nsfw
除外したい要素: [[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}, best quality, amazing quality, very aesthetic, absurdres
画像サイズ: 832x1216
シード値: 1234567815
ステップ: 28
サンプラー: k_dpmpp_2s_ancestral (native) [SMEA]
プロンプトを反映する正確度: 5
プロンプトを反映する正確度の再調整: 0
除外したい要素の強さ: 1

NAIv3 Metadata

これは酷い。低画質で下手な絵であることが一目瞭然である。注文通り、非常に低解像度で下手糞な落書きが生成された。

なぜ品質タグが必要なのか

なぜAIで高品質な画像を生成するには品質指定が必要なのか?その理屈はこうだ。

  • AIは「上手い絵」と「下手な絵」の両方を学習している。

  • AIは価値判断が出来ないので、上手い絵も下手な絵も平等に出力してしまう。

  • よって、上手い絵だけを出したいなら、そのような命令をする必要がある。

AIは価値判断が出来ないので、自分自身では「下手な絵ではなく上手い絵を描く」という判断を行わない。

人間であれば「下手な絵より上手い絵の方がいいに決まってるだろ」と思うが、AIは「上手い絵を描け」と言われれば上手い絵を出すが、「下手な絵を描け」と言われれば下手な絵を出す。どちらの注文でもなければ、両方の特徴を混ぜた微妙な絵を出してくる。

そのため上手い絵を出して欲しいならば、AIに対して「高品質で上手い絵を描いて欲しい」と明言しなければならない、というわけだ。

ポジティブプロンプト詳細

アリス (高品質指定)

では、呪文に含まれる各タグの意味を説明していく。まずはポジティブ側の呪文から。

{1girl, aris (blue archive), blue archive}, [[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}, blue eyes, black hair, very long hair, one side up, hairband, white jacket, collared shirt, blue necktie, black pleated skirt, feet out of frame, standing, smile, simple background, best quality, amazing quality, very aesthetic, absurdres

呪文(ポジティブ)

{1girl, aris (blue archive), blue archive}

この部分ではそれぞれ人数と性別、キャラクター名、版権名を指定。最も重要なので先頭に記述し、さらに{}で囲って1.05倍に強調している。

1girl : 少女1人
aris (blue archive) : ブルアカのアリス (キャラクター名)
blue archive : ブルーアーカイブ (版権名)

[[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}

この部分には絵師名と年度名が記述されており、絵柄・画風を指定。

ame (uten cacel): (絵師名)
yd (orange maru) : YD (絵師名)
muchi maro : むちまろ (絵師名)
shirabi : しらび (絵師名)
mery (yangmalgage) : mery (絵師名)
year 2023 : 2023年に描かれた作品

上記の5名は高い画力を持ちSNSで人気の神絵師たちであるため、彼らの画風をブレンドして参考にすれば必然的に上手い絵を出すことが出来る。
この絵師タグセットは、pixivのAI生成作品ランキング上位ランカーたちが多用しているセットの1つである。強度は通常の約0.9倍で適用している。

※注意点として、特定の絵師の画風・絵柄を強く模倣(丸パクリ)すると不正競争防止法に違反する恐れがある(手描き・AI生成問わず)。
このため、1人の絵師タグのみを使うのではなく、複数の絵師の絵柄を混ぜ合わせることにより、新しい独自の絵柄を生み出すことが推奨される。

最後の"year 2023"は絵師名ではなく、「2023年に描かれた作品全般」を意味する。これにより、近年流行の絵柄が反映され、過去の古い絵柄が混ざるのを抑止する効果が期待できる。

注意点:画風タグと版権・キャラタグの順番について

なお、本記事の例ではキャラ名→画風の順番に記述しているが、場合により画風→キャラ名にした方が良い場合もある。

キャラ名が先頭だと公式のキャラデザや画風をより忠実に保とうとするため、衣装変更しづらくなったり、画風タグの効きが悪くなることがある。その場合は、画風タグを先頭に記述する方がいい。

あるいは、画風タグの効果が強すぎてキャラの再現性が低下することもある。この場合は、画風タグをプロンプトの最後尾に移動させることで、画風の効果を弱めることが推奨される。

blue eyes, black hair, very long hair, one side up, hairband, white jacket, collared shirt, blue necktie, black pleated skirt, feet out of frame

この部分ではキャラクターの髪型や服装などの外観的特徴を指定している。ただしそのキャラのデフォルト衣装であれば、髪型や服装などをわざわざ書かなくてもキャラクタータグだけで再現できる場合もある。

blue eyes : 青眼 (顔)
black hair: 黒髪 (髪)
very long hair : 超長髪 (髪)
one side up : ワンサイドアップ (髪)
hairband : ヘアバンド (髪)
white jacket : 白いジャケット (服)
collared shirt : 襟付きシャツ (服)
blue necktie : 青いネクタイ (服)
black pleated skirt : 黒いプリーツスカート (服)
feet out of frame : 足元を映さない (足)

standing, smile, simple background

この3つは姿勢、表情、背景を指定している。

standing : 立っている
smile : 微笑
simple background : 単純な(無地の)背景

best quality, amazing quality

この2つは品質タグである。NovelAIでは、学習素材の品質を以下の7段階に分類してタグ付けしている。

best quality : 最高品質
amazing quality : 優良品質
great quality : 高品質
normal quality : 通常品質
low quality : 低品質
bad quality : 劣悪品質
worst quality : 最低品質

このうちbest qualityとamazing qualityをポジティブ側に追加することで、高品質の画像を生成することが出来る。

very aesthetic

このタグは美的タグである。NovelAIでは、学習素材の審美性を以下の4段階に分類してタグ付けしている。

very aesthetic : 非常に美的
aesthetic : 美的
displeasing : 不愉快
very displeasing :  非常に不愉快

最高評価のvery aestheticをポジティブ側に入れることで、美的な画像を生成することが出来る。

absurdres

absurdresは「超高解像度」を意味する。これは品質タグではないが、より解像度が高い画像ほど、より精細で高品質の傾向にあるため、結果的に画像の品質を向上させる効果が期待できる。

なお、「best quality, amazing quality, very aesthetic, absurdres」の4つは「品質タグを加える」オプションを有効化すると自動で追加されるが、手入力することも出来る。

ネガティブプロンプト詳細

次に、以下はネガティブ側の呪文を説明する。

※なお、ネガティブ側に入れるデフォルトの呪文として「除外したい要素プリセット」も用意されているが、これには余計なタグが含まれてしまう場合もあり使いづらい。このため、ネガティブ呪文に関しては全て手動で入力している。

worst quality, low quality, bad quality, bad anatomy, bad hands, bad feet, displeasing, unfinished, missing, artistic error, [abstract], lowres, jpeg artifacts, scan, chromatic aberration, signature, username, watermark, text, extra digits, fewer digits, @_@, chibi, nsfw

呪文 (ネガティブ)

各タグの意味は以下の通り。

worst quality : 最悪品質
low quality : 低品質
bad quality : 劣悪品質
bad anatomy : 解剖学的に間違っている
bad hands : 描き方が下手な手
bad feet : 描き方が下手な足
displeasing : 不愉快な(下手な)絵
unfinished : 未完成の落書き
missing : 手足や耳などの部位が欠けている
artistic error : 美術的に間違った描写
[abstract] : 前衛芸術のような抽象画
lowres : 低解像度
jpeg artifacts : JPEG作品
scan : スキャンされた作品
chromatic aberration : 色が歪んでいる
signature : 署名
username : 利用者名
watermark : 透かし模様
text : 文字列
extra digits : 余分な指がある
fewer digits : 指の本数が少ない
@_@ : グルグル目
chibi : チビキャラ
nsfw : 18禁作品

これらのタグは低品質、低解像度、破綻した人体、下手な描写などを防ぐ効果がある。ただし最後の3つのタグは用途によっては使わない方がいいだろう。

@_@:目が溶けるのを防ぐ効果あり。ただし意図的にキャラの表情を崩したい場合は利用非推奨。
chibi : 人物の等身が低すぎるのを防ぐ効果あり。ただしチビキャラを生成したい場合は利用非推奨。
nsfw : 性的描写が混じるのを防ぐ効果あり。ただしエロ画像を生成したい場合は利用非推奨。

その他のキャラでの検証結果

品質タグの効果を確認するため、さらにアリス以外のブルアカキャラの画像を生成した。結果は以下の通り。

モモイ (品質タグ無し)
モモイ (高品質指定)

ソース:Stable Diffusion XL C1E1DE52 (NAI Diffusion Anime V3)
要求タイプ: Text to Image
プロンプト: {1girl, momoi (blue archive), blue archive}, [[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}, red eyes, blonde hair, short hair, sidelocks, red bow, animal ear headphones, white jacket, collared shirt, blue necktie, black pleated skirt, fake tail, standing, :D, simple background, best quality, amazing quality, very aesthetic, absurdres
除外したい要素: worst quality, low quality, bad quality, bad anatomy, bad hands, bad feet, displeasing, unfinished, missing, artistic error, [abstract], lowres, jpeg artifacts, scan, chromatic aberration, signature, username, watermark, text, extra digits, fewer digits, @_@, chibi, nsfw
画像サイズ: 832x1216
シード値: 1234567815
ステップ: 28
サンプラー: k_dpmpp_2s_ancestral (native) [SMEA]
プロンプトを反映する正確度: 5
プロンプトを反映する正確度の再調整: 0
除外したい要素の強さ: 1

NAIv3 Metadata

ミドリ (品質タグ無し)
ミドリ (高品質指定)

ソース:Stable Diffusion XL C1E1DE52 (NAI Diffusion Anime V3)
要求タイプ: Text to Image
プロンプト: {1girl, midori (blue archive), blue archive}, [[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}, green eyes, blonde hair, short hair, sidelocks, green bow, animal ear headphones, white jacket, collared shirt, blue necktie, black shorts, fake tail, standing, :D, simple background, best quality, amazing quality, very aesthetic, absurdres
除外したい要素: worst quality, low quality, bad quality, bad anatomy, bad hands, bad feet, displeasing, unfinished, missing, artistic error, [abstract], lowres, jpeg artifacts, scan, chromatic aberration, signature, username, watermark, text, extra digits, fewer digits, @_@, chibi, nsfw
画像サイズ: 832x1216
シード値: 1234567815
ステップ: 28
サンプラー: k_dpmpp_2s_ancestral (native) [SMEA]
プロンプトを反映する正確度: 5
プロンプトを反映する正確度の再調整: 0
除外したい要素の強さ: 1

NAIv3 Metadata
ユズ (品質タグ無し)
ユズ (高品質指定)

ソース:Stable Diffusion XL C1E1DE52 (NAI Diffusion Anime V3)
要求タイプ: Text to Image
プロンプト: {1girl, yuzu (blue archive), blue archive}, [[ame (uten cacel), yd (orange maru), muchi maro, shirabi, mery (yangmalgage)]], {{year 2023}}, blue eyes, red hair, very long hair, parted bangs, hair bow, white jacket, bare legs, standing, blush, upper body, simple background, best quality, amazing quality, very aesthetic, absurdres
除外したい要素: worst quality, low quality, bad quality, bad anatomy, bad hands, bad feet, displeasing, unfinished, missing, artistic error, [abstract], lowres, jpeg artifacts, scan, chromatic aberration, signature, username, watermark, text, extra digits, fewer digits, @_@, chibi, nsfw
画像サイズ: 832x1216
シード値: 1234567815
ステップ: 28
サンプラー: k_dpmpp_2s_ancestral (native) [SMEA]
プロンプトを反映する正確度: 5
プロンプトを反映する正確度の再調整: 0
除外したい要素の強さ: 1

NAIv3 Metadata

いずれのキャラも、品質・画風指定により顕著に品質が向上している。NovelAIで良い絵を出すには、品質タグや画風タグの使い方に習熟することが不可欠だ。

この記事が気に入ったらサポートをしてみませんか?