見出し画像

ComfyUIでのプロンプト入力について:分割して入力する方法:備忘録(超初心者向け)

ちょっとComfyUIを触ってみたのですが、プロンプト入力が良く分からず難渋していました。下の動画で紹介されている方法はA1111の感覚に近い印象がありましたので備忘録的に記載しておきます。
※この内容自体は超初心者向けかつ、自分が見直したいところしか記載していないため内容に偏りがあると思います。

この動画の3:30あたりにプロンプト周りについて紹介されています。色々と細かく説明されていますのでとても勉強になりました。

デフォルトのプロンプト入力の状態

以下の様に、ポジティブプロンプトとネガティブプロントがそれぞれ1つずつ分けて入力する形になっています。ただ、A1111だとBREAK構文が使用出来ますが、ComfyUIは使えないようです。

動画で紹介された方法は、ポジティブプロンプトを複数のブロックに分けて入力されています。
要はBREAKで分けている部分をブロックで区切る感じでA1111に近い印象になります。

適当に「プロンプト分割入力方法」みたいに名付けておきます。

「プロンプト分割入力方法」の手順

とくに③④とかcomfyUIやり始めた人には分からないやり方に思います(主観)。
①カスタムノードをインストールする。以下のカスタムノードが必要なようです。comfyrollと入力して調べると出てきます
②「CR prompt text」ノードを準備する。コピペで3つほどに増殖させる。
③「CR combine prompt」ノードを準備する。
右クリックして、「convert widget to input」にする
④「Clip text encode」右クリックして、「convert widget to input」にする。

完成した図は以下

こうすると、これまでBREAKで分けていたような、品質系、人物、背景あたりを入れてA1111で思っていたのに近い感じで運用が出来そう。

SDXLのプロンプトの入力欄が2つの件

また別にSDXLのプロンプトのノードを使用するとプロンプトの入力欄が2つあります。A1111にはないので、気になったので。
下の「text_g」「text_l」のところですね。

https://www.reddit.com/r/comfyui/comments/15g9pu7/what_exactly_is_text_g_and_text_l_for_sdxl/

これは10か月前のポストになりますので、変わってきていることがあることはご了承ください。
SDXL(Stable Diffusion XL)の「text_g」と「text_l」についての議論されています。以下議論のまとめです。

SDXLでは、CLIP Text Encoderが2つのフィールド、「text_g」と「text_l」を持っています。これについて多くの人が推測していますが、決定的な結論はまだ出ていません。

背景: CLIPモデルは、テキストプロンプトを数値に変換して画像生成に利用します。SDXLでは、2つの異なるCLIPモデルが使われています。「text_g」と「text_l」はそれぞれ異なるモデルに対応しています。

「text_g」と「text_l」の違い:

  • text_g:画像の全体的な属性に強いモデルです。スタイルや雰囲気などの情報を扱うのに適しています。

  • text_l:画像の主題や具体的な内容に強いモデルです。具体的な物やシーンの詳細を表現するのに適しています。

使い方の推奨: 現時点では、両方のフィールドに同じプロンプトを入力することが推奨されています。これにより、2つのモデルの結果が組み合わされ、補完し合う形で最終的な画像が生成されます。

実験と将来的な使い方:

  • 一部のユーザーは、特定の効果を得るためにプロンプトを分けて使う実験を行っています。例えば、「text_l」に主題を、「text_g」にスタイルや雰囲気を入力する方法です。

ということで、最初に紹介している手法だと、全てまとめているため、t「text_g」と「text_l」について考える必要はありませんが、SDXLのノードを使用する場合は入力方法に気を付ける必要がありそうです。面倒だから片方を空欄にするとまずそうな気がしますね。

とりあえず作成してみました。ポニー系のSDXLモデルで作成してみました。

P1
1girl, aqua_\(konosuba\), face shot, studying .She is focused on solving problems, her posture radiating seriousness. Her expression shows a bit of fatigue, but there's a sense of determination to keep going.
P2
in a bright room. Textbooks and notebooks are spread out on the desk. The walls of the room are decorated with colorful posters, and soft sunlight streams in through the window.
P3
score_9, score_8_up, score_7_up, best quality, masterpiece, 4k, uncensored, prefect lighting, rating_explicit, very aesthetic, anime

参考というか、備忘録的にワークフローを貼り付けておきます。AYSを入れるとステップ数は10以上は必要なようです。


この記事が気に入ったらサポートをしてみませんか?