見出し画像

4.さらにstable diffusionを学んでいくと

今回はimg2img

受講3回目。前回はtxt2img、テキストからイメージ画像を作成する方法だったが、今回はimg2imgということで、画像をアップしてそれを加工するというもの。
使い方としては、構図をそのまま使いたい場合によい。

例えば下は私の母の写真。これをもとに若い女性に変換。

母親の写真
変換した画像

詳細を設定していないので、目とか少しおかしいし、よく見ると指もおかしい。

inpaintという機能

これはinpaintという機能で修正可能。
ただ。これもコツがある。inpaintの修正とプロンプトやネガティブプロンプトで修正とを加えていく。
inpaintは修正したい場所をツールで塗りつぶし、そこをプロンプトで修正していく。なかなか思ったとおりにはならないが、根気よく画像を生成していく、あるいはプロンプトをいじっていくという作業で克服する。
凝れば凝るほど時間はかかる作業だ。

PNG info

素晴らしい生成画像を見つけた時に、そのプロンプト情報等を入手可能。そのままそれを使えば同じ画像が作成できる。もちろん著作権や商用利用についての制限を認識把握して使う必要がある。
プロンプトを作成するにはこれが勉強になる。

作成した画像から情報を入手

この画像の情報は下記の通りとなる。
一部紹介となるが、プロンプトは次の通り。

(full body shot), solo, best quality, masterpiece, ultra high res, (photorealistic:1.4), RAW photo, portrait, full body, (front-forward), natural standing,
(extremely beautiful woman), 28yo, japanese, neat, (extremely detailed eyes and face:1.5), beautiful and narrow eyes, (no makeup), extremely detailed skin,
perfect body, tall, long hair, light smile, indoor,
ネガティブプロンプトは次の通り。
Negative prompt: illustration, 3d, sepia, (painting), cartoons, sketch, (worst quality:2), (backlight:1.2), bad anatomy, bad hands, double navel, collapsed eyeshadow, multiple eyebrows, freckles, signature, logo,

なんとなく意味が分かるような気がする。()は強調してという意味。プロンプトを呪文というが、AIに対して話かけている雰囲気はまさに呪文だ。

ほかにも

高画質化や解像度のアップなどができる。ただこの辺りはPCの性能、とくにGPUの性能とVRAMの容量により生成時間が大きく変わってくる。

今回、高性能な方のゲームPCを購入した。これでOfficeソフトを操作するととても速いというかストレスがまったくない。
YouTubeも4Kで美しく再生できる。

あと2回で終わるが、講師の方が要領よく教えていただけるのでスムーズに理解ができている。ただ、慣れるというか場数を踏むことが大事だとよくわかった。

だいぶ慣れてきた!

この記事が気に入ったらサポートをしてみませんか?