見出し画像

【AI生成ガチャ】ファッショナブル・ウーマンメイキング【ローカル全自動】

上イメージ記事のメイキングです。

はじめに

筆者はすぐに手を入れてしまうので、あまりプロンプトを主とした生成は行わないのですが、Ollama + ComfyUIを利用した全自動AI画像生成手法のアイデアです。すべてローカルに拘った生成です。

※ AIまかせなので、手などはおかしいままです。

準備

Ollama(ローカルLLM)+ComfyUI(Stable Diffusion)を導入します。詳細は下記事に紹介しています。

流れは、次になります。

  1. OllamaでLLMを利したプロンプト生成を行います(カスタムノード:comfyui-ollama)

  2. SDXLモデルで生成します。

  3. SD1.5モデルで解像度を上げて品質向上させます。

  4. 完成

脱獄LLMでプロンプトを生成

もちろん「脱獄」である必要はないのですが、NSFW判定やポリコレの影響を受けにくくなります。ローカルで表現の自由を満喫しましょう。世に出せないものが出来てしまったらボツにすればいいだけですから。

ComyUIプロンプトの自動生成

品質プロンプト(RAW photo, masterpiece等)と生成プロンプトを結合しています。(ComfyUI_Comfyroll_CustomNodes)

つまり、

"fashionable young woman, bun hair"

LLMへの指示

によって、

RAW photo, masterpiece, high quality, highly detailed, intricate cloth, intricate background, concept art, slender thin,, A fashionable young woman with a bun hairstyle posed in front of a brightly colored background surrounded by flowers and plants while holding a vintage camera and wearing trendy clothing and accessories like layered necklaces and bold jewelry pieces.

結合された(ポジティブ)プロンプト

が生成されます。このプロンプトで画像を生成します。

SDXLで画像生成

構図を生成します。SDXLである必要はなく、SD3ならより良いかもしれません。モデルも含めてプロンプトに対して(品質よりも)表現力豊かなものを選びます。

※ SDXLモデルは筆者カスタムモデルを利用しています

SDXLでモデル生成

ノイズ画像スタートで詳細を増やす手法を利用しています。

SD1.5で仕上げ

(現実に存在するような)写真画風の場合はSD1.5の品質が最も良いので、SD1.5でアップスケールを行います。

SD1.5モデルで仕上げ

モデル・アップスケールとして「NMKD-Superscale-SP_17800_G」を利用します。※ 4倍固定モデルなので、1/2にして2倍にしています。

※ SD1.5モデルは(アジア系人物)カスタムモデルを利用しています

完成

完成

あとは「Queue Prompt」ボタンの連打で画像を量産します。

まとめ

LLMでプロンプトを生成する事で、完全ランダムなプロンプト入力よりも「テーマ」に絞った画像を自動生成させる事ができます。

以下関連記事の【PR】です。


この記事が気に入ったらサポートをしてみませんか?