見出し画像

DrawThings(画面説明2024)

項目が増えたことにより説明文が追加されているので、改めて機械翻訳したものを載せる(主に自分のために)。翻訳したと言ってもすぐに内容がわかるものではないけれど。
ぱっと見では細かく設定を保存できたり、画像サイズの設定をアイコンからできるようになっていたりする。

画面左メニュー1

構成

名前を付けて保存

モデル

画像生成に使用するモデルを選択します。 汎用モデルはすべてに適していますが、特定のモデル (ワイフ拡散など) はアニメ スタイルの生成に適しています。

ローラ

LORA (Low-order Rank Adaptation) は、個別にトレーニングされた小さな加算モデルを安定拡散ベース モデルに適用する手法です。 通常、完全なモデルを微調整するよりも、これらをトレーニングする方が高速です。

コントロール

加算モデルは、画像生成プロセスをガイドする追加の制御を提供できます。 多くの場合、落書き、ポーズ、深度マップ、またはエッジ マップの形式で入力を受け取ります。 これらの加算モデルは、指定されたバージョンの Stable Diffusion とのみ互換性があります。 「重み」は、コントロールが画像生成プロセスにどの程度の影響を与えるかを決定します。 「プロンプトなし」では、プロンプトなしで画像を生成できます。 「開始」と「終了」は、ノイズ除去プロセス中に追加のコントロールがいつ開始されるかを決定します。

強さ

画像から生成する場合、値を高くすると、オリジナルからの芸術的な自由度が高まります。 100% は、既存の画像 (テキストから画像) の影響がないことを意味します。

シード

シード値は、イメージ生成の開始方法を決定します。 同じシードからは同じ画像が生成されます。

シードモード

シード モードは、シードの使用方法を決定します。 「レガシー」は古い Draw Things アプリと互換性があり、「NVIDIA GPU 互換」は NVIDIA GPU / Linux / Windows 上の AUTOMATIC1111 や Invoke.Al などの他のデスクトップ ツールと互換性があり、「Torch CPU 互換」は macOS 上の他のデスクトップ ツールと互換性があります 「Scale Alike」を使用すると、異なる画像サイズでもシードがある程度の類似性を維持できます。

画像サイズ

生成される画像のサイズ。 最良の結果を得るには、1:1 / 標準を使用してください

アップスケーラー

アップスケーラーは、比較的小さな画像 (例: 512x512) から視覚的に快適な高解像度画像 (例: 2048x2048) を生成するのに役立ちます。 使用するアップスケーラーによっては、さまざまな詳細が入力され、微妙に異なるスタイルが導入される場合があります。

ステップ

画像生成に適用されるステップの数。 より多くのステップを使用すると、より良い画像が得られますが、時間がかかります。

テキストガイダンス

テキスト入力をどの程度「文字通り」処理する必要があるか。 設定を高くするとテキストに忠実になり、設定を低くすると芸術的自由度が高まります。 (CFGスケール)

サンプラー

異なるサンプラーは異なるステップ数で収束する可能性があり、結果として表示スタイルが異なる場合があります。 Euler A はより「夢のような」画像を生成することが知られていますが、DPM 2M Karras はわずか 30 ステップで高品質の画像を生成できます。

リファイナーモデル

「リファイナー」モデルは、後の画像生成段階 (100% に近い仕上げ) で使用でき、多くの場合、画像の詳細を大幅に改善できます。 これは、画像から画像への変換を行うよりもコスト効率の高い方法です。

クリップスキップ

「CLIP Skip」は、テキストエンコーダーの最後のレイヤーから何レイヤーをスキップするかを制御します。 テキスト エンコーダーは、テキストをコンピューターが理解できるベクトルに変換します。 テキスト エンコーダーでさらに多くのレイヤーをスキップすると、コンピューターは単語の組み合わせた意味よりも個々の単語に重点を置くようになります。 これは、タグのようなテキスト入力を微調整するモデルに役立つ可能性があります。

マスクブラー

「マスクぼかし」は、マスクのエッジを少し柔らかくしようとします。これは、画像の残りの部分とブレンドするのに役立ちます。

顔の修復

顔の復元では、追加のモデルを使用して、画像生成中に小さく歪んだ顔を修正できます。 このプロセスは、フォトリアリスティックな画像に最適です。 アニメや芸術的な画像の場合、これは望ましくない可能性があります。

バッチサイズ

バッチで同時に生成される画像の数。

高解像度の修正

1回目のパスサイズ
1回目のパス幅
1 回目のパスの高さ
2回目のパス強度
高解像度修正は、最初のパスの画像生成に選択したサイズを使用し、その後、選択した強度で画像間の生成を適用して、ターゲット サイズに達するまで調整します。 直接生成する場合はオブジェクトの重複を回避し、汎用アップスケーラーを使用する場合よりも詳細を生成する傾向があります。

生成した画像を保存

生成された画像は任意のフォルダーに保存できます。 これにより、外部アプリケーションを使用して生成されたイメージを整理することが容易になります。

HTTP APIサーバー

「HTTP API サーバー」は互換性のある HTTP API サーバーを実行し、txt2img または img2img API を使用する拡張機能が画像生成のためにローカルに接続できるようにします。 世代は Draw Things インターフェイスに反映されます。

T.I. 埋め込み

「テキストの反転」または「埋め込み」は、テキストで表現するのが難しいものを表現するために訓練されることがよくあります。 これらは、スタイル、キャラクター、またはいくつかの一般的な概念を指す場合があります。


街歩きがさらに楽しくなるものがあるといいな