見出し画像

t2i ポン出しにおける「綺麗な手」という幻想を捨てろ

・前書き

 こんにちは。こんばんは。
 水色の焦土です。

 ここ数日、あまり精神状態が良くなく(もう AIイラストの未来などお先真っ暗だ……)みたいな気持ちになっていたのですが(別にそれはわたしが決めることではない)、そういうときは新しいプロンプト群をChatGPTから調達したり、テンプレプロンプトを弄ったりすると結構画面作りが変わるもので、そういう気分転換が功を奏したりして(またやっていくか……)みたいな気持ちになれるのでオススメです。
 モデルによってテンプレクオリティプロンプトの効き方も違うものですしね。あえて除外した「masterpiece」を復活させたりしても面白いかもしれないですね。

(「masterpiece」と言うとマスピ顔をどうしても連想するのですが、こう、様々なタイプの顔を出力するモデルが増えてきている昨今、マスピ顔という言葉が指す顔というのも曖昧になってきたような気がします。「CounterfeitV3.0」「AnithingV4.0」「AOM3」「BreakDomain」シリーズ、「HimawariMix」などキャラ出力が特徴的なモデルは現在無数にありますが、それらに「masterpiece, 1girl」と入力して出力する顔はかなり違ってくると思うのですが、誰か検証しているひととかいるんですかね……?)

(顔の好みが極端なので、あまり他のモデルを使ってどうこうしたい欲がありません。あと絶賛、物理的にパソコンがぶっ壊れそうな(ぶっ壊れ始めている)ので、あまりこのパソコンに無理をさせたくありません)

(気になった方がいれば検証お願いします。わたしはあまり興味がありません。検証せずとも、わかりきった結果が出るような気がしています)

(あえてマスピ顔らしい顔を選ぶとするなら、NAI出力のような気もしますね。そう呼ばれていた時期的にも)

(丸括弧で無限に話題を逸らしていく芸はほどほどにした方が良いと思いました)

 というような感じなのですが、今回は「敢えて今まで目を逸らしてきた事実」に目を向けて、これからのことを考えていこうと思います。

 ではどうぞ。


・「理想の手」に囚われる悲しき俺たち

 悲しい俺たちの物語なのさ……。


 さて。

 AIイラスト生成に手を出して真っ先にぶち当たる最初の壁。

 それはズバリ、ですね。

 AIイラスト生成は手から始まり、手に終わると言います。

 手さえ良ければ……。手が崩れていなければ……。

 AIイラスト生成者たちは手の破綻に親を殺されていますので、そりゃあもう死に物狂いで手の破綻を隠蔽し、修正し、ガチャし直します。

 手の破綻を無くすためならありとあらゆる新手段を試すことでしょうし、当然ペンタブを引っ張り出して修正したりもすることでしょう。

 わたしはペンタブを引っ張り出してクリスタをこのぶっ壊れ掛けているパソコンにインストールしたりするのが死ぬほど面倒なので、t2i ポン出しに徹しているというスタンスで t2i ガチャを永遠に回し続け、別のアプローチでこの問題に取り組んでいました。

・破綻と戦うアプローチ

・bad-hands-5

 まずわたしが手を出したのがこちら。
 超大御所の手矯正embedding「bad-hands-5」。

 こちらを使用し、倍率を1.5倍くらいまで高めたりして効き方を見ながら、(なんかめちゃくちゃ絵柄とか色合いとか変わるんだけど……その割りに効きも悪い……)という思いを抱きながら次の方法を探し始めます。残念ながらここまでの行動がテンプレです。


・badhandv4

 続きましたるはこちら。
 これまた超大御所の手矯正embedding「badhandv4」。

 こちらを「[:(badhandv4:1.5):17]」みたいにNPに入力して使うのが流行りましたよね。当然わたしも使っておりました(どういう意味かというと、「badhandv4」を17ステップ目から1.5倍で効かせる、という感じです。サンプリングステップの終盤で急激に効かせることで絵柄や構図への影響を抑えられるそうです)。

 ただ、これまた効きを実感できない。どころか塗りや描写の細かさにめちゃくちゃ影響している気がする……。そうしてこのembeddingを投げ捨て、新しい何らかを探しに出掛けます。


・negative_hand-neg

 こちらも大御所embedding「negative_hand-neg」。

 結論から言うと、このembeddingはあらゆる意味で生成物に一切の影響を与えないそうです。

 本当にありがとうございました。


・GoodHands-beta2

 LoRAというかLoConというか。

 先日までわたしが使っていたLoRA?LoCon?です。

 体感的なもので検証もしておらず申し訳無いのですが、恐らくキャラクターの腕から先のポージングにめちゃくちゃ影響する気がしています。これが、というよりかは、このLoConを起動させるための推奨PPとNPが悪さしているような気がします。

 PP「nice hands, perfect hands」NP「(extra fingers, deformed hands, polydactyl:1.5)」ですね。NP側が怪しいと思っているのですが、検証していませんので真相は闇の中です(この記事は検証記事ではございません)。

作例1
作例2
作例3
作例4

 こういう手が死ぬほど出てきます。

 これ、なんなんでしょうね……。手を合わせたり謎の球体を持とうとしたりします(球体は恐らく雰囲気PPの「atmosphere」という単語が悪さしているような気がしています。「atmosphere」の「sphere」成分が、ハッキリしない雰囲気指定の時に描写する要素として抜き出されている印象です)。

 作例3における、マンガ的表現の「やれやれ」みたいなポージングの出力も頻度が高めです。

 作例2の、物体を下から掬い上げるように持ったときに、指が横側に無限に増えていくのも風流な表現のような気さえしてきました。

 つまりどういうことかというと、

 ポージングの幅が狭まる上に、綺麗な指の打率はさして上がらない

 ということです。

 これらのembeddingやLoRAを長らく使ってきたわたしの体感ですので、そう間違った認識ではない自負があります(間違っている可能性もあります。わたしの自負は実際の効果の機序を何ら保証しません)。

 恐らくこの手のembeddingやLoRAを学習するうえで、手っ取り早く見栄えが良さそうな人間の手のかたちに収束する代表的な作例が幾つかあり、そこからランダムで出力されている(そして失敗もする)だけのような気がしています。

 統計的に見ると、手のかたちとして成り立っているパターンは、何も対策をしないよりかは多くなっているような気もしますが、それとキャラクターのポージングの幅を天秤に掛けたときに、どちらを取るのが良いかというのは一目瞭然に思えます。同じポージングの生成物が手を替え品を替え出てくるのを眺めているのは、わたしには結構しんどい状況でした。

 参考にさせて頂いたのは、るぺったん氏のこちらの記事。


 というわけで、わたしは全ての手に影響するあれこれを取っ払いました。

 ノーガード戦法ということです。

 色々なポージングが出てくる方が絶対に楽しいですし、同じような構図の生成物をこれ以上見たくないという気持ちがわたしにこうさせたワケです。


 外すとわかる、embedding や LoRA の偉大さ……。

 完全に制御を失った崩壊の数々を見るのは久しぶりだったので、(あんな打率でもちゃんと仕事していたんだなぁ……)みたいな気持ちになりました。

 皆さん、手の崩壊を防ぐお守りやおまじないはちゃんとプロンプトに仕込んでから出力しましょうね。こういう破綻が一番オモんないですからね。

 ……で終わると思ったら大間違いですよ。


・飼い慣らせない手の破綻へのアプローチ

 イラスト製作を行ったことがある方々なら同意して頂けることかとは思うのですが、描けないものと向き合うのってかなりしんどいんですよね。

 手というのは別に AI だけが苦手としているわけではありません。

 イラスト初心者も等しく手が苦手なのです。

 イラスト初心者というのは基本的に見たままのものしか描けないので(見たままのものさえ満足には描けない)、フリーポーズ集や自分の手を参考に手を描くことになり、美少女を描いたはずなのに手だけおじさんになってしまうということはままあることかとは思います(おじさんではなくとも、デフォルメには多大な技術を要するので、やたら手だけ写実的になったりもします)。

 そういったときにどうするのか?

 後ろ手に隠すなり、フレームアウトさせるなりするんですよね。

 しかし、AI というのはそこまで臨機応変には対応してくれません。

 手だけ上手にフレームアウトさせて出力させることって難しいんですよね(「selfy」とか入力すれば良いのですが、今度は腕が破綻してくるので難しいですよ)。後ろ手に組ませるのは可能でしょうが、それもまぁ構図縛りみたいになりそうですよね。バストアップにすれば良いのですが、わたしのモデルだと顔のアップが非常に不得手でめちゃくちゃに顔が破綻してくるので八方塞がりです。あとバストアップを無限に生成させられる胆力のあるひとというのもなかなかいない気がします。

 はい。

 ということでね、とっておきの対応策を教えます。

 萌え袖です。

 手が破綻するなら隠せば良いじゃん!と思ったのですが、これかなりすごくて、手を完全に隠すのはそんなに打率高くないんですが、指だけ露出するにしても、ある程度手が隠れた状態になるので、そこまで破綻しないですし修正もめちゃくちゃ簡単になるんですよね。

 絶対試してるひと多いだろうなぁと思ったんですけど、あまり試してるひとがいないのも驚きました。萌え袖ってフェチの類いになるんですかね、機能的な目的って結構盲点だったのかもしれません。ですので、プロンプトを安定させるのがとても大変でした。

・PP

(her long sleeves:1.3, her overly too long sleeves:1.3, her sleeves past fingers:1.3, her sleeves past wrists:1.3)

・NP

her hands:1.3, her fingers:1.3, her wristband:1.3

 これをプロンプトに仕込んでみてください。

 飛ぶぞ。

(文法的に正しくないのでしょうが、「her」を付けると途端に成功率が上がりました。NPに「hands」「fingers」だけ入れてもまったく手も指も隠してくれず途方に暮れていたのですが、人物指定をすることで打率が一気に上がりましたね。これは他に応用できそうなプロンプト術っぽいです。倍率指定はお好みで。他への未知の影響を考えるともう少し倍率を下げても良さそうです)

 参考にさせていただいたプロンプトの元ネタはこちら。

 この方も間接的に仰られていますが、もしかするとオトナな女性にこのプロンプトを適用させるのは難しいのかもしれません。こころなしかいつもの魔女っ子が幼く出力されることが多い気がします。

 特別万能な方法論ではありませんが(全体的に、特別打率が良いということはありません。ただ、片方の手が完全に隠れたり袖から露出する手の面積は大幅に減るので、ノースリーブや半袖縛りをしている方ではないのなら、修正もしやすくなって良いのではないでしょうか。界隈が萌え袖で溢れてもそれはそれで面白くありませんが、手段の一つとして)こういう抜け道を考えるのはとても楽しいです。破綻を楽しむのもヨシ、破綻を回避するのもヨシということで、皆様も色々と考えてみてください。

 それをわたしにも共有していただければ嬉しいです。


・後書き

 ということで、今回は「理想の手」とどう向き合うのかについて考えてみました。

 なんかもっとスマートにできれば良いんですけどね。修正や i2i ガチャを避けるならこの辺が限界な気がします。手や指や脚が沢山ある状況を正当化できるシチュエーションってやっぱり思い付かないですよね(メカ娘は捻りが無いとして、他に考えられるものだと「空間が歪んでいる」とか「高速移動に伴う残像」とかそういうものしか考えられませんね。まったく応用性のないシチュエーションで頭を抱えています)。

 ですのでこれは現状、もっとも応用の効く手と指の隠し方だと思います。

 この方法論が手の破綻に困っている俺たちの希望になってくれれば良いのですが……。

 以上です。

これはやりすぎて腕を振り回せる拘束衣みたいになってしまった図

この記事が気に入ったらサポートをしてみませんか?