tanuki

生成画像AI, FLUX.1, Ponyについて色々調べて記事を書きます。

tanuki

生成画像AI, FLUX.1, Ponyについて色々調べて記事を書きます。

最近の記事

FLUX.1 使えるプロンプト:女性水着編

女性水着編だ。 細かいビキニは反映されないようだ。また一部の単語も認識されていない。 今回からdevで作っているので、表現や厳密性が上がってる。 認識されなかったプロンプト High-rise bikiniハイライズビキニ cross halter bikiniクロスホルタービキニ tankiniタンキニ Tank top Bikiniタンクトップビキニ High-waist bikiniハイウエストビキニ Short pants bikiniショートパンツビキニ Shor

    • FLUX.1 dev 生成速度アップ、VRAM節約方法

      FLUX1は、従来の画像生成よりも、パラメータ数が多いため、モデルも大きくメモリ、VRAMを使い、かつ時間もかかる。 ローカルで実行する場合、いかにVRAM消費を少なくし、速度をあげるかに苦労するだろう。 単純実行でも、VRAM12GBでも、かなり厳しい。1024x1024以上のサイズを(上限1~3分程度で)作ろうとすると、現実的にはVRAM16GB, Loraを使おうとするとVRAM24GB必要だろう。 というわけで、今までやってきたVRAM節約=速度アップの方法を書

      • FLUX.1 使えるプロンプト:表情編

        表情編だ。 表情はかなり認識されているようだ。ただ、一部の表情や、絵文字系、鼻系は認識されないようだ。 認識されなかったプロンプト howl(遠吠え) noisy(騒がしい) embarrassed(恥ずかしがっている) half-open eyes(半開きの目) ;d(ウインクしながら笑う(顔文字)) sharp nose(尖った鼻) button nose(団子鼻) bulbous nose(球根状の鼻) aquiline nose(鷲鼻) hooked nose(鉤鼻

        • FLUX.1でアニメ化を抑える方法

          FLUX.1はネガティブプロンプトがない。そのため素の状態で画風を特定のものにそろえる方法論がない。 リアル調の絵を作ろうとしたら、なぜかアニメ風の絵が出たりというのはよくある。これを防ぐ方法を検討してみた。 方法論としてはいくつかある。 1.NegativePromptを使う→微妙 ただ、速度が1/3程度に落ちる。最初の数ステップだけにネガティブをつけその後は普通に作るという方法もあるようだが、絵柄のようなものはネガティブしにくいようだ。RTX3060(12GB)で

        FLUX.1 使えるプロンプト:女性水着編

          FLUX.1 使えるプロンプト:女性髪型編

          女性髪型編だ。 髪型はかなり認識されているようだ。 認識されなかったプロンプト drill hair(ドリルヘア) bald(はげ) fluorescent blue hair(蛍光青髪)

          FLUX.1 使えるプロンプト:女性髪型編

          FLUX.1 Forge,windows,RTX3060@12GB で少ないVRAMで大きな画像を作る

          環境 ・Windows10 ・RTX3600 12GB ・Memory 64GB stable-diffusion-webui-forgeのインストール forgeモデルは、メモリを省力化でき、早いというメリットがある。実際に使ってみて、この環境だとどのような設定がバランスがとれるのかを探してみた。 構築に参考にしたのはこちらの記事。 CUDAとpytorchをバージョンを合わせて入れなおした。 CUDA 12.1 + Pytorch 2.3.1 追加でxformer

          FLUX.1 Forge,windows,RTX3060@12GB で少ないVRAMで大きな画像を作る

          FLUX.1 使えるプロンプト:ポーズ編

          引き続きポーズ編だ。 一部のプロンプトはうまく認識されないようだ。 認識されなかったプロンプト arched back(反り返った背中) upside-down face(逆さまの顔) paw pose(肉球ポーズ) claw pose(爪ポーズ) arms behind back(腕を背中の後ろに) seiza(正座) indian style(あぐら) wariza(割座) yokozuwari(横座り) all fours(四つん這い) fetal position(

          FLUX.1 使えるプロンプト:ポーズ編

          FLUX.1 使えるプロンプト:クオリティ編

          引き続きクオリティ編だ。 認識されるものもあるが、こちらが想定している反応をしてないもの、3D/2Dなどが切り替わるものもあるようだ。 こちらは、複数の表現があり、切り替わるようだ。AsianGirlよりJapaneseGirlのほうが2Dの確率が高い。 3Dプロンプト masterpiece best quality high resolution 4K 8K photo photograph snapshot 2D/3D混合プロンプト detailed highly

          FLUX.1 使えるプロンプト:クオリティ編

          FLUX.1 使えるプロンプト:女性衣装編

          引き続き女性衣装編だ。 かなり認識されているが、直球なワードは使えないようだ。 無効だったプロンプト latex thong buruma school swimsuit nappy loincloth garter belt zettai ryouiki underboob 違う意味になってしまうプロンプト cutwork(刺繍の内部を切り抜いてレースに→切り絵に) one piece(漫画のワンピースに)

          FLUX.1 使えるプロンプト:女性衣装編

          FLUX.1 Windowsで構築した時のメモ

          構成 windows10 RTX3600 12GB メモリ32GB → 64GB(生成時間が1/4に) メモリを増量してみる(32GB→64GB) まず、23GBのモデルがメモリに展開されるため、ここでメモリの上限にぶつかっている場合は、メモリを増やすことをお勧めする。 メモリを増やした結果、生成速度がだいぶ上がったのでおススメ。 512x512,schnell:80s→20s 1024x1024,dev:500s→110s

          FLUX.1 Windowsで構築した時のメモ

          FLUX.1で使えるプロンプト:女性編

          FLUX.1の画像生成がかなり良いようなので、出力具合を調べてみた。 FLUX.1とはFLUX.1は、Stable Diffusionの開発者たちが新たに立ち上げたBlack Forest Labs (BFL)が2024年8月に発表した最新の画像生成AIモデルです。高品質な画像生成能力と柔軟な利用方法で注目を集めています。 FLUX.1の主な特徴 高性能: Midjourney v6.0やStable Diffusion 3 Ultra、DALL-E 3などの最新モデル

          FLUX.1で使えるプロンプト:女性編