Novel AIの仕様メモ

2022年10月11日 03:58

Novel AIを触って仕様ぽいものをメモっていく。
絵は描けない、プログラミングは嗜んでいる。

パラメータ

prompt：表示したいタグみたいなもの
- 単語だけではなく文章でもそれっぽくなる模様
Undesired Content：除外リスト
- 例えば赤髪を出したいのに青が出やすいときにはblue hairをいれれば表示確率が減る
- extra nipple（副乳）のようなものを入れるとAI特有の乳首が2つ存在する絵もある程度省ける
Steps：AI調整反復回数
- 回数こなすとより線がはっきりしたり細かくなる
Scale：promptの考慮度
- より厳密に従うかどうからしいがあまりわからない
- 低いと淡い感じ、強いと濃い絵になる特徴として使われがち
Seed：乱数の調整値
- よく絵柄を固定と言われるが乱数値が固定されるだけでパラメータ次第では全然変わる
Image Resolution：画像のサイズ
- 学習に利用した絵の傾向に依存するため、横向きに適した絵というのも存在する
strength：（image2image専用）Original絵への近さ
noise：（image2image専用）わからない
- enhanceするときに調整できるがよくわからな

生成絵のパラメータを知る方法

　生成した絵をNovel AI画像右下の保存ボタンから保存するとEXIFにパラメータが保存されている。
この基本的にはパラメータを完全再現することでほぼ同じが生成できる。
※ 例外1：image2imageを行った場合はtext2imageだけでは不可能
※ 例外2：Variationsで生成された絵もおそらくimage2imageされている

　気をつけないといけないのが2つある。まず1つはAdd Quality TagsのトグルをONにしていると自動的に masterpiece, high qualityが先頭につく。2つめはUndesired Content内の「Low Quality + Bad Anaton」をつけるとUndesired Content設定（＝除外設定）にあらゆるパラメータ実はついている。これらがどう気をつけないといけないかは次の項で説明する。

　Macではプレビュー→ツール→インスペクターを表示をすると表示される。自分はRuby好きなのでmini_exiftoolというgem（=ライブラリ）で表示している。Windowsでは触ってないのでわからない。

ほぼ同じイラストを再度出す方法

　ほぼ同じイラストを出すのは実は理解していないと結構難しい。同じイラストにするための条件を思いつく限りで書いてみると下記のようで、つまり表示されている全てのパラメータを一致させる必要がある。

text2imageで生成されたイラストである
promptsが完全一致している
- 前述したAdd Quality Tagsの自動追加に注意
- promptsの順番、強弱指定すらも一致する必要あり
Image Resolutionが一致している
Undesired Contentが一致している
- Low Quality + Bad Anaton欄による自動追加に注意
- 自分で追加した項目ももろに影響を受ける
Steps, Scaleが一致している
Seedが一致している
（NAI Diffusion Anime(FULL)や一番下のAdvanced: Samplingも一致させる必要はあるとおもうがまだここをいじるほどさわってない）

　よくある再生成できない例としてはUndesicred Contentの指定漏れや、トグルによる自動追加の考慮漏れ、promptsの順番違いなどはよくミスる。

Valiationsとは

一度生成した絵に対して3パターンの追加絵を出すことができる。これが内部的に何をやっているかを生成された絵のパラメータを見る限りでわかったこと

Original絵をimage2imageしている
stepsを50で生成
scaleは一致
strengthは0.8やnoiseは0.1で生成
- strength0.8 --> オリジナルに近め
- noise0.1 --> そんなにおかしいことはしない設定（不明）
seed値はOriginalとは別で、新規絵のSeed値は1ずつ違う
- originalが100だとしたら新規絵は300, 301, 302みたいな

ここで注意したいのがseed値が設定されているが、これはあくまでimage2imageのseed値で、text2imageとのseedとは別と思われる。

今後

Novel AIというより画像生成AIにまつわる周辺で発生しそうな流れ

イラスト構図の文字化＆辞書化
- 今までは特徴的なものだけだったが、今後はあらゆる構図やポーズに対して単語、説明文言が定義され辞書化される
promptの補助ツールが生まれる
- 例1: 人物指定などを文字ではなく画像から選択していく
- 例2: 画像をprompt化する
パラメータチューニングによる自動生成
- 前述の通り変化しうるパラメータが多すぎる
- 結構近いんだけど微調整したいというとき
- steps: 15~28, scale: 0.5~2.0, prompts強弱の組み合わせなど
画像解析により精度を上げる
- 現状でも自動化で1000枚作ること自体はできるが吟味がきつすぎる
- 髪色が黒であること、手が存在していること、このポーズに近いetc…
promptの精度の数値化
- 大量生成→画像解析によりpromptの精度が数値化できそう
- 学習データにかなり強い依存があるが…

この記事が気に入ったらサポートをしてみませんか？