見出し画像

日刊 画像生成AI (2022年9月7日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"果たしてどこまで行くのか…"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


昨日までの投稿はこちら!


大ニュース


Stability.aiが最大10億ドルの評価額で資金調達を交渉中!!


開発


シンプルなプロンプトジェネレーター公開

https://www.phase.art/  というシンプルなプロンプトジェネレーターが公開されました。Prompt builderよりUIが良さそう。早く活用したい。


Textual Inversionがやりやすくなった

textual inversionをやりやすくまとめてくださっている方がいるのでご紹介。

学習はこちらのcolab。

生成はこちらのcolab。

またしかも、その学習データがこちらにまとまっております。ワクワクが止まらない..。沢山あるので以下選別したものを紹介。

例えば、このビンを学習したものや、

backroomのプールを学習したもの

textual inversionの資料に載ってる猫を学習したもの

この画風を学習させたものなど、いろいろあります。


Waifu Diffusion公開

Stable Diffusionの新しい微調整されたものが公開されました。
Danbooruというアニメ画像サイト(ちょっとえっちな画像寄りっぽい)5.0e-5 の学習率で 56,000 個の Danbooru のテキストと画像のペアで微調整されているそうです。結果はどうなるのか。いかに。

Prompt: touhou 1girl komeiji_koishi portrait


表現


Nintendo Switchblade

craiyonで生成されて、過去にかなり伸びていたようなのでメモ。

https://www.reddit.com/r/StableDiffusion/comments/x7z2i2/ever_wonder_what_nintendo_switchblade_looks_like/ & https://www.reddit.com/r/weirddalle/comments/x7jxgo/nintendo_switchblade/


猫耳の女の子

可愛くて、Redditでも評価が高かったのでメモ。

Prompt:
Blonde haired beautiful girl with bunny ears, in slavic clothing, fluffy bunny ears, with fit hourglass body, snowy forest background, photorealistic, painted by artgerm, Akihiko yoshida, sakimichan, krenz cushart, low angle shot, digital painting
Steps: 100
Cfg: 12

https://www.reddit.com/r/StableDiffusion/comments/x7hv0d/girls_with_literally_bunny_ears/


研究


Stable Diffusion 1.5はどうなのか

誘導能力やクオリティが上がっていそうです。(それぞれ得意不得意があったりするので数枚で比較できるかは謎ですが..)手の出力がおかしくなる問題がMidjourneyにも、Stable Diffusionにもあるのですが、1.5では治っておらず、1.6、その次のv3で治る可能性があります。

1.5
1.4
https://www.reddit.com/r/StableDiffusion/comments/x7zq42/v15_is_more_accurate_at_least_in_these_examples/


モーフィングの研究

すぎゃーんさんがstable diffusionでモーフィングをうまく実行されています。技術メモがブログに上がっているので要チェックです。


midjourney + Crypko + dalle2

なかなかクオリティが高い、CrypkoはGANで高品質の2Dキャラクターの立ち絵が生成できるサイトです。
GAN系を使って、組み合わせればかなりいいやつが現状でもできますね。
https://crypko.ai/


リアルレンダリングへの簡単なヒント

Midjourneyでのリアルなレンダリングのためのコツについて記載されている方がいました。以下引用です。

https://www.reddit.com/r/midjourney/comments/x7hf4y/quick_tips_for_realistic_rendering/

異なるライティングタイプを組み合わせることで、現実の写真に近いフォトリアリズムレンダリングを実現できることが分かりました。そのために使ったのが、エピック、シネマティック、ドラマティック、ボリューミーなライティングです。さらに、顔、目、髪、体のレンダリングを細かく指定します。ボディを細かくレンダリングすることで、手が消える問題も多少は解決できる。また、肌の色をオリーブ色や褐色などに指定することもできます。肌の色の代わりに国籍を指定すると、キャラクターの民族性は変わりますが、外見は変わりません。また、スカーフをつけると、よりエレガントでワルな印象になりますね。)

Prompt:
Calming beautiful + geek gothic woman Nordic + cyberpunk tactical soldier combat engineer, olive skin, silver blue titanium camo patterns, finely detailed modern army armor, finely detailed face, finely detailed hair, finely detailed body, finely detailed eye, camo scarf, long wavy hair, character design, photography, octane render, dramatic lightings, epic lighting, cinematic lighting, volumetric lighting, unreal engine, intricate details, extremely detailed, very high details, photorealistic, hi res, hdr, uhd, fiery, hyper detailed, ultra realistic, vibrant, centered, in frame, real, --no gun, --s 2800 --ar 16:9 --testp --creative --upbeta --upbeta

Stable Diffusion 髪の毛のInpaintingの検証

キャラクター生成にはもってこいですね。大量に生成できてしまう。


分かりやすいtext2imghd

以前紹介したStable Diffusionで生成した画像の画質を遥かにアップするテクニック、text2imghdを分かりやすく解説してくださっている方がいるのでメモ。


思想・ムーブメント


深津さんインタビュー公開。

深津さんの投稿がバズってからみんなMidjourneyを触り始めた気がします。分かりやすく画像生成AIの現状、今後、社会への影響などについて語られています。


ヴィラン作品を本にしようと考えているけどどうかな?

この日刊でも以前紹介させていただきましたが、kingmyda82さんは以前からヴィランの作品をよく投稿されていました。


LatentSpaceの怪談

ネガティブプロンプト(テキストから画像を生成するわけではなく、AIがなるべくプロンプトと違う画像を作成しようとするもの。)を使うと、なぜか謎の恐ろしい老婆が現れるという話。

試しにやってみたらちょっとほっぺたが赤くなった。このやり方ではない?


最後に


昨日も研究、開発が沢山進んでいますね。気付いてない部分でもっと研究されている方々がいると思うのでもうちょっと深ぼってチェックしたいです。

Twitterに、毎日製作したものや、最新情報、検証を載せているのでよかったらフォローしてね

https://twitter.com/Yamkaz


次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます