マガジンのカバー画像

Diffusers/Stable Diffusion まとめ

10
Diffusers使用の自作GUIなど、Stable Diffusion関連
運営しているクリエイター

記事一覧

アイコンを作る

作ってみたものの。 UIとアイコン ゲームに限らず、現在の道具には何かしらのアイコンや絵がついていて、道具の使い方や機能のヒントをユーザに示しています。 制作中のゲームでも、メニューや操作のアイコンを表示することにしました。 作ってみたキャラ絵をStable Diffusionに「発注」したように、私には絵を描く能力はありません。なのでアイコンのデザインもStable Diffusionで作りました。 当初はアイコンを切り抜いて完成品にしようと思ったのですが、最終的にはS

立ち絵を立体的に見る

Stable Diffusionで立ち絵をいくつか作りました。手作業が入るとはいえ、量産の流れが出来るとそれなりに手が進みます。 立ち絵ができたので、ゲーム画面作成に手を付けました。周回ゲーのようなものをUnityの2Dモードで作るつもりです。解像度やアスペクト比など、最初に決める必要のある設計項目がすでに多くて難しいですが、勉強を兼ねてやっていきます。 高解像度化と深度推定 立ち絵の量産に入って思ったのですが、やっぱり自作GUIにも生成画像の高解像度化機能を組み込ん

立ち絵を作ってみた

前回の記事である程度形にしたStable Diffusionの自作GUIを使って、ゲーム素材に使う立ち絵を作ってみました。正確には立ち絵を作る練習。幅990px ×高さ1320px の絵を作ります。 作業の手順は備忘録として以前にも似た記事を書いたのですが、改めて手順を整理しました。 txt2imgで背景を作るまず背景画をtxt2imgで作成します。後の工程でほぼ背景は消えるので、ここで作る背景画はシード値の一種という意味合いではあるものの、キャラの絵に与える雰囲気を形に

StableDiffusionPipelineの改造に手を出した

マスクの向こう側の世界には何がある? まだ機能が足りない 前回の記事の後、体調を崩しましたがすぐ治りました。疲労がたまっていたのかもしれません。 さて先月にDiffusersベースの自作GUIをある程度作りこんだのですが、素材を作ろうとして機能が足りないところが出てきました。 ・768サイズのモデルで画像生成がうまく動かない → Diffusers公式のコミュニティパイプラインにあるLPW pipelineなら動作する (Long Prompt Weighting, カッ

ネガティブプロンプトだけで作ってみた

すみません、タイトルの絵はネガティブプロンプトにプロンプトとして"masterpiece one girl"だけ足してます 別の遊びとして組んでいるプログラムが一段落したので、Stable Diffusionの自作GUIでちょっと遊びました。 画像生成するとき、上手く書けていない画像の抑制をするためにネガティブプロンプトをよくつけます。自作ゲーム素材用に使うネガティブプロンプトをちょっと考えていたのですが、ふと魔が差し、ネガティブプロンプトだけで画像を作ったらどんな感じにな

DiffusersベースのStable Diffusion自作GUIをGitHubに置きました

依然として休養中ですが、生活に変化がありました。メインPCが戻ってきました。メインとは言え事務用PCの性能ですが、キーボードが打ちやすい…! 自作GUIをGitHubに置きました さてタイトルの通り、上の記事にもある自作GUIをGitHubに置きました。記事の後も修正を続けたり、Readmeという名の説明書を作ったりしました。GitHubを使うのも初めてなので、うまく出来ているかどうか。 格好つけて完成した段階でまとめてrebase & pushしたものの、ちょこちょこミ

DiffusersベースのStable Diffusion自作GUIを使ってキャラ画像を作る

 上の記事の続きです。自分用のメモとして、自作GUIを使ったキャラ画像作成の作業の流れを書きました。  内容は自作GUIでの手順ですが、本家AUTOMATIC1111版でも手順は同じです。むしろ本家の手順を再現できるように自作GUIを組みました。 背景にキャラをinpaint  まず背景にキャラを書き込みます。latent noise等でinpaintするか、簡単な初期画像を書き込んでimg2imgします。  マスクはStableDiffusionでは白色が適用範囲となる

DiffusersベースのStable Diffusion自作GUIを使う

 既存のDiffusersベースのGUIだと画像生成の試行錯誤がしづらかったので、自作GUIの作成を続けています。AUTOMATIC1111版web UI(以下本家)が心の師匠です。 前回からの変更点 ・七師氏のDiffusersベースライブラリ "Unstable Diffusion" を使用して画像生成。latent noiseでのinpaintを実現できた https://github.com/nanashi161382/unstable_diffusion ・U

メモ:NumPyとPyTorchの配列について

 Stable Diffusion で画像を作るため、自前でAutomatic1111版っぽいGUIを作ろうとしています。とうとう画像データの中身を扱う必要が出てきたので、画像のデータ構造を一度勉強しようと思いました。特にPillow, NumPy, PyTorchの画像データの構造がいまいち分かっていなかったので、下のページを見てまとめてみました。 https://imagingsolution.net/program/python/numpy/python_numpy_p

Google Colab無料分でStable Diffusion v2-1モデル(768x768)が動作するAUTOMATIC1111版っぽいGUIを作りたかった

供養としての記事。 Colab無料分の環境だと、RAMが足りなくて落ちるんだもん 要約https://note.com/it_navi/n/n64fd73e6b531 さんの記事で紹介されている、 https://github.com/qunash/stable-diffusion-2-gui のようなものを作りたかった いきさつ 休養中に Stable Diffusion などのAI画像生成のトレンドがあることを知って、これはゲーム作成にも使えそう面白そうだと遊びは