ChatGPTで作った画像をComfyUIでアニメイラスト化する

2024年6月20日 22:45

読んだ。

画像生成AIでいい感じの画像を作るためには語彙力が必要だが、それをLLMで補うという話である。それもLLMが組み込まれた画像生成WebUIなので、別サービスから手動でコピペしなくていい。

複数紹介されておりどれも良さそうだが、特にLumina-T2Xが気になる。というのも、t2iがComfyUIのNodeとして公開されたというのだ。時間があったら俺が最近作ったワークフローに組み込んで試したい。

そのワークフローが本題である。

これが何かというと、DreamShaper XL Turbo workflowをベースに、フォルダに突っ込んだ大量の画像をバッチ処理で任意の画風にi2iするワークフローである。

何がしたかったか説明しよう。以前、こんなnoteを書いた。

画像生成においてLLMはプロンプトを膨らませるだけでなく、様々なバリエーションを勝手に考えさせることにも使える。そこで俺はChatGPTに世界各国の豊穣の女神の画像を作らせた。いい感じのができたら壁紙にしようと思って。

いい感じのできたが、一つ問題がある。ChatGPTで作れる横長の画像サイズは1792x1024で固定。これでは4kディスプレイの壁紙に使うには小さい。Stable Diffusionを使えばアップスケールできるが、それでも荒い部分が拡大されると見れたものではない。

そこでi2iで拡大することを考えた。これなら拡大に応じて書き込み量を増やすことができる。ついでに実写風からアニメ風に変換することもできるし。だが、AUTOMATIC1111でやるには限界があった。

それは俺がバリエーションのある形で大量の画像を作っていたことである。1枚を変換するだけなら、適切なプロンプトを入力し、i2iしてやればいい。しかし、俺が変換したいのは数百枚単位だ。いちいち画像に合わせてプロンプトを考えたくはない。

かといって全て共通のプロンプトにすると、適切なi2iにならない。例えば上の画像の場合、鳥が葉っぱになり、山が大木に変わったりした。別のだとピラミッドが山になったりと。何とか各画像に適切なプロンプトが自動で適用されるようにしたい。

この問題を解決したのが、あのワークフローである。画像からプロンプトを推定し、それに共通のプロンプトを追加して流し込んでやるのだ。

ここから先は

510字 / 5画像

この記事のみ ¥ 100

骨しゃぶりを支援するためのメンバーシップ。定期購読マガジン「骨しゃぶり書簡」を無料で読める。自発…

¥500 / 月

月額500円で入ることで、定期購読マガジン「骨しゃぶり書簡」を無料で読める。普通にマガジンを購読するよりも手数料の分だけ俺に金が多く渡る。

¥1,000 / 月

月額1,000円なので、通常の倍のお布施をすることが可能なプラン。定期購読マガジン「骨しゃぶり書簡」を無料で読める。メンバー特典記事があるかもしれない。

人に対し何かをしてあげるという事は、全て「見返り」を期待しての行為だ。noteのサポートは文章を読むための「見返り」である。