見出し画像

Pony Diffusion V6 XLの本当の魅力

SDXLのアニメモデルで圧倒的な存在感を持つPonyV6モデル
実はとっても高性能なのに、あまり知られてはいません。

プロンプトを一文字変えるだけで以下の表現の幅が出せます。

公式に沿った標準出力
一文字だけ変えて出力

Loraも使ってないしSeedも他の設定も全て同じです。
この様に、表現力が他のモデルよりも高すぎるが故にその制御が難しいだけで、モデルが劣っているわけではないのです。

Ponyの魅力は7変化

実はPonyはアーティトスのスタイルの再現に優れているモデルです。
Animagineがアニメキャラの再現に特化しているのと対象的に、Ponyはスタイルの再現が多様です。

この場で「このアーティストを使え!」なんて言えないので絵柄の探し方を書きます。
Ponyを研究しているレポートがあります(通称:Pony Note)

このノートの下の方に一部のタグと出力が載っているので参考にすると良いでしょう。
実際に試してみるとかなり出力が違ったりするので、これだけを参考にしない方が良いです。

隠されたPonyの能力...

実はPonyにはまだ隠れた能力があります。
Ponyはアーティストやキャラクターを三文字の記号として管理していたようです。
その三文字が何故か学習に反映されており、特定の記号を入れるとそのスタイルが再現される能力があるのです。

プロンプトは「1girl, 記号」のみですがこれだけの表現力が眠っています。

ただし、この能力には注意点があります。
お馴染みのPonyの品質タグ「score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up」を加えるとacmを除いて特徴がかき消されました。

更に詳細な指示を与えると殆ど影響は無くなってしまいます。

品質タグを使わなければ影響が出てきますので、PonyV6の品質タグ達は色んな意味で呪縛となっている様です。

これらの記号の扱いに関してはまだまだ検証の余地が合って、これから良い組み合わせなど見つけたら追記していきたいと思っています。

という事で、この三文字記号をどこで見つけれるのかと言うと先程の「Pony Note」で見ることができます。
「Reverse Engineered Hashed Tokens」という項目で色々見ることができます。

例えばaaa ~ bzmまでのリストはここで見れます。https://files.catbox.moe/c0rl1r.jpg

使い方としてお気に入りの記号をポジティブに入れるのはもちろんのこと、出てきてほしくない絵柄をネガティブに入れて制御する方法も模索できそうです。

この記事が気に入ったらサポートをしてみませんか?