【モデル解説】Pony Diffusion for Animeのおすすめの設定と使い方

センシティブ術師.R18

2024年3月30日 22:54

モデルリンク

モデルの概要

PonyV6を元に追加学習されたモデル。
特定のキャラクターを狙って出力するようにはトレーニングされていないベースモデルとのこと。

モデルの推奨設定

プロンプト順序：「score, 1girl/1boy/2girls..., characters, copyright, style, general tags, rating」
ネガティブプロンプト：「score_4, score_5, score_6, source_pony, source_furry, monochrome, 3d, photo, hyperrealistic, realstic, rough sketch, fewer digits, extra digits, signature, artist name」
その他はPonyV6と同じと推測される。

詳細な説明

詳細設定はPonyV6と同じ。PonyV6の推奨設定は以下の記事で解説。

・プロンプト順序

タグ順序はPonyと同じと書いてあるが、実際にはAnimaginと同じタグ順序である。
「score, 1girl/1boy/2girls..., characters, copyright, style, general tags, rating」

・スコアタグの変更について

PonyV6と大きく変わっている点として、スコアタグの役割変更がある。
score_9：高品質のイラスト
score_8_up：リアルな質感
score_7_up：アニメ

品質タグに特定のスタイル「source_anime」の意味を持たせてしまっているので良い変更とは言えない。
この変更により、PonyV6本来のスコアタグの使い方は有効ではない。

使い方の研究

以降の内容にはR18要素が含まれます。閲覧の際は予めご了承ください。

警告

・スコアタグの影響

まずはスコアタグの変更の影響を確かめる。

学習自体は期待通りに進んでいるようで「score_7_up」に関してはかなりアニメ寄りになる。

注意点としてリアルの表現は苦手で出力の安定性も低いので「score_8_up」は強調しすぎると破綻する。

基本は「score_7_up」を使用して、質感のプラスとして「score_9」や「score_8_up」を使うのが良さそうだ。

その他の言及のないスコアタグも、ポジティブに入れて影響を調べる。

言及されていないだけあって大きな変化は見られない。
しかし、よく見るとスコアが下がるに連れて書き込みや臨場感が薄く、のっぺりとした印象を受ける。

以上の調査を踏まえてスコアタグのみでアニメから少しリッチな絵柄まで３段階で組み合わせてみた。

説明：ポジティブ | ネガティブ
左：(score_6 , score_7_up:1.2) | score_4, score_5, score_8_up
中：score_9, (score_6 , score_7_up:1.2) | score_4, score_5, score_8_up
右：score_9, (score_7_up:1.2) | score_4, score_5

・ソースタグの影響

このモデルでは言及されていないがPony由来のソースタグの影響についても調べる。

「source_cartoon」に関してはカラー漫画のような質感になってとても良い。
「source_pony」と「source_furry」に関しては1girlと指定してしまってるので参考程度だが、ネガティブに入れても良いかも知れない。

以上を踏まえてポジティブに「source_cartoon, source_anime」、ネガティブに「source_pony, source_furry」を追加して複数のSeedで出力した。

漫画の表紙イラストのような表現になった。
漫画的な表現が増えるのでネガティブに追加で「mosaic censoring, speech bubble, sound effects, motion lines」などを入れると良い。

・レートタグの影響

レートタグの影響は「rating_safe」にだけ違いが有り、他はレートタグ無しと大きく変わらず、わざわざプロンプトに入れる必要があるのかは疑問。

最終的な設定

今までの調査を踏まえて最終的に落ち着いた設定は以下の３種類。

説明：ポジティブ | ネガティブ
左：score_9, score_8_up | score_4, score_5, score_6, source_pony, source_furry, monochrome, 3d, photo, hyperrealistic, realstic, rough sketch, fewer digits, extra digits, signature, artist name
中：score_6 , score_7_up, 1girl, source_anime | source_pony, source_furry, mosaic censoring, speech bubble, sound effects, motion lines
右：(score_7_up:0.6), 1girl, (source_cartoon:1.2) | source_pony, source_furry, mosaic censoring, speech bubble, sound effects, motion lines

左は公式の推奨設定に近く、meina pastelのようなオイルペインティングに使い雰囲気になる。

中はフラットなアニメ感を強調した設定で、Animaginに近い雰囲気となっている。

右は漫画のカラーページのような設定で、他のモデルではあまり見ない塗りなので使っていくかも知れない。

総合評価：★★★★☆

※個人的な見解です。
他の優秀なSDXLモデルと比べると若干、破綻が多いが、表現力の豊かさは随一で独自の追加学習がされている事は確か。

特定のキャラクター名で出力することを想定していない分、スタイルの指定のみで色々な絵柄を出力できるように作られている。

また、全ての出力に対してアウトラインがくっきりとしている点はこのモデル特有の現象。

この記事が気に入ったらサポートをしてみませんか？