Stable Diffusionで癖の画像RTA(Any%)

注意

理論値です。実測値ではありません。再現性もありません。
わたしは3時間ほどで大まかに理解ができそれなりに望んだものが作れるようになりました。
つよつよの人はもっと早いはずです。
あとAI自体法律が不十分なので法律に触れないよう十分注意して行ってください。

前提条件

GPUがついているPC(RTX3080なんていりません。2000番台でも重いけど充分動く)
Gitの基礎知識(なくてもいける)
Pythonの基礎知識(ないなら+5分〜かかるかも)
ネットリテラシー

ありそうな質問
Q.
なんでGoogle collab使わないんですか?
A.こんなかに簡単だからって取り回しのききづらいやつで癖の画像作るやついる?
シコる時にもう今日これでいっかって思うヤツいる?

Google Collabでも課金すると使いやすいですよ(月1000円くらい)

Q.なんでネットリテラシーいるの?
A.法律が未整備&議論や炎上が起こりまくってるので社会的、金銭的、インターネット的に詰む可能性がある。
ダウンロードが必要なものも多く、悪意のあるものを避けるリテラシーがないとハッキングを食らう可能性がある。 等

ものすごく雑だがアフィリエイトがない解説

1 必要なもののダウンロード

・Pythonの3.10番台をインストールします。
・並行してGitもインストールしてGitが使えるようにします。(使わなくてもいける。詳細は下記)
・インストールしている間にUnstable Diffusionのサイトに行きdiscordサーバーに入ります。(任意)(全部英語)

Unstable Diffusionとは?
Stable Diffusionで禁止されているものがあるのに対し、表現の自由を守るためのコミニティーです。色んな人が色んなことをしています。ついでに無料(時間経過でクレジットが回復)で画像生成をさせてくれるので試しに使ってみてもいいかもしれない。

インストールしている間にUnstable Diffusion鯖内で好みの画像をいくらか見つけます。虫眼鏡のスタンプを押すとbotから個人チャットで画像に使われているプロンプトやモデル等の情報が送られてきます。(任意)
10枚くらい参照して使われているModel, LoRA,promptの特徴を把握します。(任意)

モデル、LoRA、プロンプトの説明

Modelとは画像を学習させたデータです。これによって絵柄が大きく変わります。2D,3D, リアルな感じ,絵柄などがこれによって大きく変わってくるので自身の好きなものを選びましょう。

RoLAとは簡単に言ってしまえばアペンドディスクみたいなもんです。ハーイっていう人じゃないです。ピンポイントに欲しいものがある場合これを使うことにより欲しいものを出力できます。
簡単に説明すると学習内容と1つのキーワードを=で結ぶみたいなものです。
例えば初音ミクの画像ばっかりを集めて、キーワードを初音ミク にして作ったRoLAを入れた場合、プロンプトの初音ミクという部分がRoLaによりかなり正確な初音ミクになります。
ちなみにRoLAは権利関係が怪しいものばっかりなのでほんとに気をつけた方がいい。

プロンプトとはおまじないと言われるやつです。
なんかこんな感じにごちゃごちゃした感じになっていますが初心者は75ワード以内にしときましょう。
基本的な解説をすると、(〜〜: 1.1)のようにカッコで囲って数字を入れるとその内容の出る確率を変えられます。1がデフォルトです。
1.1ならその内容の出やすさが1.1倍になります。0.8なら内容の出やすさが0.8倍になります。詳しく学びたい人は英語でググッてください。
ポジティブプロンプトとネガティブプロンプトがありますがこれはそれぞれ見たいもの、見たくないものみたいな認識でいいです。
詳しく学びたい人は(ry
例えばおねショタ画像が作りたい、でも逆転ありなのは嫌! という場合はポジティブプロンプトにおねショタを、ネガティブプロンプトに逆転を入れるみたいな感じです。

インストールしている間に使いたいModel,RoLa,promptを決めます。権利関係がヤバめなものがあるのでそのへんは適切に避けましょう。

2 様々な用意

git cloneでStable Diffusion webuiをCloneします。gitを入れていないならここに行ってzipファイルでダウンロードしてきます。(右上緑色のcodeボタン→Download ZIPでダウンロードできます。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Stable Diffusion webuiのファイルからModelという欄を探してきます。そこにダウンロードしてきたモデルとRoLaを入れます。モデルとRoLAはcivitaiとかHaggingFaceとかでダウンロードしてきてください。

3 画像生成

Stable Diffusion webuiからrun -userという名のバッチファイル(拡張子が.bat)のやつがあるので実行します。すると勝手に依存関係とかをインストールして起動してくれます。
128.122.22みたいな数字の羅列が出るのでそれをブラウザで開きます。CTRL+左クリックで開くと時短できてRTA的にいい感じです。(環境や設定によって違うかもしれないので注意)

緑色のところにURLが出ます。python3.9.5でやっていますが怒られます。3.10代を使ってください

ローカルなので違う端末で開いてもアクセスできません。注意
ModelとRoLaを選択したあとプロンプト入れて合成します。Stable Diffusion webuiのことを詳しく学びたい人は(ry

という感じにとっても簡単なのでみなさんやってみて下さい。質問はTwitterにて受け付けております。

この記事が参加している募集

AIとやってみた

課金すると仮想通貨についてたくさん書きます。もちろん課金された分は全部ETHになります。あと本が買えるようになります。