記事一覧
SD-WEBUI-FORGEのDev2版のインストールについての話
最近、SD-WEBUI-FORGEはアップデートされないなーと思いつつ、個人的には不便なところはなかったので、そのまま使用していたのですが、Discussionの所で、Dev2版のブランチが更新されたとのアナウンスがありました。
ざっくりとした内容としては、メインで運用されているllyasvielさんがFORGEのアップデートを行えない状態で、他のFORGEをサポートしているメンバーはメインを更新
RB-modulation:なんだか便利そうな技術っぽい:IP-adapter的なもの?
Redditを見ていたら、このような技術が公開されていました。
まだ、codeが公開されていませんので、使用はできないですが興味深い技術の様に思います。
Preprintの論文を要約してもらいました。
タイトル: RB-Modulation: Training-Free Personalization of Diffusion Models using Stochastic Optimal C
ConfyUIのKoha HR fixとアップスケールについて:確かにForgeより効果が良い気がする!
これまでのワークフローにアップスケールを入れていなかったのですが、試してみてよかったという内容です。
リンクの記事で紹介されている方法を参考にしました。
ワークフローがまとまっていてとても分かりやすかったです。
この記事では、アップスケールがらみで大きく二つの拡張機能を取り上げます。
Koha HR fix
先ほどの記事で、ConfyUIにある、KoHaHR fixについての言及がありまし
Impact wild card:リストからランダムにプロンプトを入れる系:ComfyUI
以前、ポニーの記事を記載しましたが、キャラクター一覧がとてもたくさんあって選び難い経験をされた方も多いかと思います。
Stablediffusionのダイナミックプロンプトというのがあり、私は使用していませんが、リストからランダムにプロンプトを入力してくれる拡張機能です。
ComfyUIだと、「Impact wild card」がそれに相当するようです。
上のサイトがとても詳しく使い方を説明
Deforumのプロンプト入力を楽にする方法を考えてみた:ComfyUI編
ComfyUIのDeforumのデフォルトプロンプト欄は以下のものです。
これはA1111と同じ形式ですね。
0:" tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, 4k, landscape --neg nsfw, nude"
さて、話は
最近出た高速化技術:DMD2:ComfyUIで試してみた
高速化に関する技術の様です。
高速化に関しては色んなのがあって、これはどうなんでしょうか?
論文がありましたので要約は以下です。
題名: Improved Distribution Matching Distillation for Fast Image Synthesis
発行年: 2024年5月24日
どんなもの?
この論文は、画像生成の効率を向上させるための新しい手法、DMD2(Distr
LLM+ComfyUIの「LaVi-Bridge」 vs 「ELLA diffusion」 vs 「通常生成」を比較する
2024/5現在ですが、以前の記事で紹介したこともある「ELLA-diffusion」がありますが、そこのGithubでも言及されていますが、「LaVi-Bridge」というものもあります。
Title: Bridging Different Language Models and Generative Vision Models for Text-to-Image Generation
Yea
ComfyUI-ELLA&AYSが出来る件について:ComfyUIでSDXL&AYSをする
LLAのGithubサイトで、ComfyUI-ELLAと以前の記事で紹介したAYSを併用したフローが紹介されていました。
どちらもプロンプト追従性を高める技術であり、併用されるとさらに強みが増すと思われます。
このフローを読み込むと、上側がAYSを使用したパターン、下側がELLAのみのパターンの2つを同時に作成することが出来、簡単に比較できます。
下のは、若干変更を加えています。
「Anyth
Align Your Steps(AYS)とは?sd-webui-forgeのdev2に追加された機能(2024/5)
この機能は、forgeのdev2に最近追加されました。
論文がありましたので、記事にしました。
論文の題名と著者名、発行年
題名: Align Your Steps: Optimizing Sampling Schedules in Diffusion Models
発行年: 2024
どんなもの?
この論文は、ディフュージョンモデル(DM)におけるサンプリングスケジュールを最適化するための新
ComfyUI-ELLAを試してみた
以前、記事に記載したELLA diffusionですが、ComfyUIで試すことが出来ます。
ワークフローもあります。
導入方法
モデルの配置
Githubサイトから以下のモデルをダウンロードして配置する必要があります
クリックすると行けるhuggingfaceのサイトからダウンロードできます。
配置場所は「models」フォルダーで新たに作成する必要があります。
「ella」フォルダーに
e
PaperspaceでComfyUI&Deforumを動かす:Deforum base jsonの動作解説
Paperspaceで ComfyUIを動かす方法については、リンクのサイトに説明があります。
基本的に同じなのですが、備忘録と、Deforumのノードの作業内容についての解説を合わせて記事にしました。Deforumのノードについての記事は日本語ではほぼないので珍しいかと思います。あくまで個人的な経験を記載していますので、参考までにとどめてください。
※一時ディレクトリ版にしたいところですが、まだ
Ponydiffusion系のモデルについての備忘録的なもの(2024/5)
Civitaiでどんどん増殖しているPonydiffusion系のモデルについての備忘録です。
アニメーション作成によく使用させていただいています。
この記事では、polydiffusionについて詳細な説明をすることはなく、ただ自分の使っている部分のみを記載したものになります。
上のリンクにpolydiffusion系について説明されています。
最初の文をみると「NSFW系の豊富な知識を持った
PaperspaceのGPU争奪戦のPowerAutomateコマンドについて雑感
前回記事を公開してから試行錯誤をして、感じた事を適当に書き綴ります。
Powerautomateは、それぞれの操作を具体的にコマンドとして準備する必要がありますので、それまで直感的にやっていたことと若干のずれがあり、その摺り合わせみたいなのにたどり着くのに時間がかかりました。
フローを検討している中で、改めて分かったこととてしは、paperspaceのGPU取得に関しては、2パターンあり、それ
A1111:v1.80インストールコマンド(一時ディレクトリ用):VRAM消費検証とReforumの使用雑感:2024/5版
以前の記事で、ReforumというDeforumの実験的なブランチの紹介をしました。Forgeでも使用可能なのですが、A1111だとコントロールネットも使用出来るため、その方法について模索していました。
表題にあるように、最新のA1111のバージョンはv1.93なのですが、その特徴の一つである、「サンプラー」と「スケジューラー」を分けて設定するという機能に対応していません。
そのため、「サンプラー
ReforumというDeforumの実験的ブランチを試してみた話(UI紹介編)
DeforumのDiscordでReforumというブランチがあることが言及されています。GithubのHPの最初に、作者の方が追加した機能について言及しているのですが、とりあえず個性的でユニークな印象でした。
面白そうだったので、インストールをしてみたいと思います。
Sd-webui-forgeでインストールしています。Automatic 1111でも使用可能とのことです。
今回はインストール