見出し画像

【新モデル】Animagineの後継モデルが新登場!「kivotos xl 2.0」と「holodayo xl 2.1」の使い方を解説

SDXLアニメ時代を開拓した伝説のモデル「Animagine」を開発したLinaqrufさんが新モデルをアナウンスしました。
その名は「kivotos xl 2.0」「holodayo xl 2.1」です。


モデルリンク

モデルの概要

kivotos

このシリーズは「ソシャゲ」キャラを正確に再現することに特化したAnimagineの追加学習モデルです。
特に2.0では「Blue Archive」系のビジュアルスタイルを再現するように調整したと明言しています。

Animagineの特殊タグを引き継いでいます。
・品質タグ:「masterpiece, best quality, great quality, good quality, normal quality, low quality, worst quality」
・規制タグ:「safe, sensitive, nsfw, explicit」
・年代タグ:「newest, recent, mid, early, oldest」
・美観タグ:「very aesthetic, aesthetic, displeasing, very displeasing」

公式おすすめ設定:

  • タグ順序:「1girl/1boy, character name, from which series, by which artists, everything else in any order.」

  • 品質タグ:「masterpiece, best quality, very aesthetic, absurdres」をプロンプトの最後に入れる。

  • ネガティブ:「nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn」

  • サンプラー:「Euler a」がとてもおすすめ

  • ステップ:25 ~ 30の間で、28がベスト。

  • CFG:5 ~ 7の間

holodayo

このシリーズは「VTuber」を正確に再現することに特化したAnimagineの追加学習モデルです。
Animagineの特殊タグを引き継いでいます。(割愛)

公式おすすめ設定:
kivotosのおすすめと全く同じものです。

比較:単純出力

まずは公式のおすすめ設定に従ってシンプルに出力し、絵柄の変化を比べたいと思います。

何度か試した結果、
- Animagineはオレンジ系の色
- Kivotosは青系の色
- Holodayoは緑系の色
という癖があるとわかりました。
これらの色はプロンプトで指示したわけではないですし、シードが別でも法則性があるので、モデル固有の癖だと思われます。

絵柄の変化は、全体的に優しくて丸い印象を持ち「ブルアカ」っぽいという印象になりました。

注意:ポジティブに「official art」と指示するとネガティブに「watermark, signature」と入っているにも関わらず下にガッツリとサインの様なものが表示されています。
公式作品であるとの誤解を招くような表現」に抵触する可能性があるので投稿する場合には消した方が良いです。

比較:解剖学が向上しているか

特に手の崩壊が改善しているかを見ていきます。

手の解剖学が向上しているとは言えません。
やはり手の崩壊に関してはモデルの性能ではなく、もっと潜在的な原因で学習困難が起きていると予測されます。

  1. 形が変わること
    目は通常2つで場所も固定ですが、手は見え方や動かし方によって本数も形も違います。

  2. 手の命令が少ない
    形の変わるのにも関わらず、どういう状態かを指示するプロンプトは存在しません。モデルは手の状態に対する学習が困難です。

それではもう少し色々な例を見てみます。

air_quotesはニッチなタグ過ぎました。

ハンドサインは比較的上手くいくことが多かったです。
やはり、手の形自体に名前が付いている指示は崩壊が少なめです。

比較:構図表現が向上しているか

個人的にAnimagineの優れている点は、優秀な構図の理解でした。
他のモデルでは、公式立ち絵の様な整ってるけどのっぺりとした出力をする事が多いですが、Animagineはダイナミックな表現ができます。

from ~~

from ~~ は元のAnimagineでも優秀なのもあり、構図自体の変化はありません。

遠近感のある表現

遠近感のある表現は、Animagineから更に向上していることが分かります。
こういった奥行きのある表現はこれまでのモデルでは難しく、Animagine系列のお得意技です。
しかし、細部の崩壊をどう修正するかが重要そうです。

撮影技法

Holodayoだけ明らかに撮影技法の反応が良いです。
AnimegineとKivotosはpanoramaであまり反応していません。

私は個人的には構図やダイナミックさに拘りたいのでHolodayoの使い方を更に掘り下げていくかも知れません。

比較:絵柄の柔軟性はあるか

アートスタイル

右が比較対象となる元の出力です。
一番大胆に変化するにはAnimagineです。
次点でHolodayo, あまり変化しないのはKivotosです。

アーティスト

※誰か分かってもコメントを控えてください
モデル全体として傾向はなく、アーティストによってかなり効きが違います。
一番柔軟性があるのはHolodayo,
次点でKivotos, あまり変化しないのがAnimagineとなりました。

絵柄でもHolodayoは総合的に柔軟性が高く、表現力が高くて汎用性のあるモデルの可能性があります。

結局Animagineを超えているのか

モデルの基礎能力のみの評価になります。
比較を通しての感想は、Holodayoは明らかに柔軟性と表現力が上回っています。
Kivotosは項目によってはAnimagineを上回ったり、逆に柔軟性が低くなる点も有りました。

HolodayoもKivotosも目的特化型のモデルにも関わらず表現力が上がっています。

比較として不公平なので載せませんでしたが、アニメキャラの再現はAnimagineが一番、ソシャゲはKivotos、VTuberはHolodayoという当たり前の結果になりました。
特定のキャラ再現が目的の場合は、特化領域に応じて使い分けるのが良いです。

更に調査予定の項目:
- NSFWの出力性能は変わっているか

また、SD関連で有用な情報があったらTwitter(X)にDMをください。

この記事が気に入ったらサポートをしてみませんか?