![見出し画像](https://assets.st-note.com/production/uploads/images/86444428/rectangle_large_type_2_f82b601e0d5f0cdf4471df4559164677.png?width=800)
日刊 画像生成AI (2022年9月7日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
![](https://assets.st-note.com/img/1662619761070-oCGN2c3QL5.png?width=800)
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
昨日までの投稿はこちら!
大ニュース
Stability.aiが最大10億ドルの評価額で資金調達を交渉中!!
開発
シンプルなプロンプトジェネレーター公開
https://www.phase.art/ というシンプルなプロンプトジェネレーターが公開されました。Prompt builderよりUIが良さそう。早く活用したい。
![](https://assets.st-note.com/img/1662593223005-ZRdVNWHvJK.png?width=800)
Textual Inversionがやりやすくなった
textual inversionをやりやすくまとめてくださっている方がいるのでご紹介。
学習はこちらのcolab。
生成はこちらのcolab。
またしかも、その学習データがこちらにまとまっております。ワクワクが止まらない..。沢山あるので以下選別したものを紹介。
![](https://assets.st-note.com/img/1662593508640-w4HtSwM6Z0.png?width=800)
例えば、このビンを学習したものや、
![](https://assets.st-note.com/img/1662593484663-kCIyi190JW.png?width=800)
backroomのプールを学習したもの
![](https://assets.st-note.com/img/1662593486623-AwW01oSGiL.png)
textual inversionの資料に載ってる猫を学習したもの
![](https://assets.st-note.com/img/1662593798403-oIBbdIC1Gy.png?width=800)
この画風を学習させたものなど、いろいろあります。
![](https://assets.st-note.com/img/1662593834197-87EzUEs4in.png?width=800)
Waifu Diffusion公開
Stable Diffusionの新しい微調整されたものが公開されました。
Danbooruというアニメ画像サイト(ちょっとえっちな画像寄りっぽい)5.0e-5 の学習率で 56,000 個の Danbooru のテキストと画像のペアで微調整されているそうです。結果はどうなるのか。いかに。
![](https://assets.st-note.com/img/1662592102063-jib1JMeaSO.png)
表現
Nintendo Switchblade
craiyonで生成されて、過去にかなり伸びていたようなのでメモ。
![](https://assets.st-note.com/img/1662590452916-UAgd9Oijuh.png?width=800)
猫耳の女の子
可愛くて、Redditでも評価が高かったのでメモ。
Prompt:
Blonde haired beautiful girl with bunny ears, in slavic clothing, fluffy bunny ears, with fit hourglass body, snowy forest background, photorealistic, painted by artgerm, Akihiko yoshida, sakimichan, krenz cushart, low angle shot, digital painting
Steps: 100
Cfg: 12
![](https://assets.st-note.com/img/1662620670143-54oZRo67CI.png?width=800)
研究
Stable Diffusion 1.5はどうなのか
誘導能力やクオリティが上がっていそうです。(それぞれ得意不得意があったりするので数枚で比較できるかは謎ですが..)手の出力がおかしくなる問題がMidjourneyにも、Stable Diffusionにもあるのですが、1.5では治っておらず、1.6、その次のv3で治る可能性があります。
![](https://assets.st-note.com/img/1662590600168-pbWWFEPUWN.png?width=800)
![](https://assets.st-note.com/img/1662590595928-ySkyV12Cur.png)
![](https://assets.st-note.com/img/1662590898888-SjDSJ1Ko4T.png?width=800)
![](https://assets.st-note.com/img/1662590901396-NaYQ0EM516.png?width=800)
![](https://assets.st-note.com/img/1662590903145-TKWiXlZOT6.png?width=800)
モーフィングの研究
すぎゃーんさんがstable diffusionでモーフィングをうまく実行されています。技術メモがブログに上がっているので要チェックです。
#stablediffusion 完全に理解した pic.twitter.com/IR5yjnL07Y
— すぎゃーん💯 (@sugyan) August 31, 2022
midjourney + Crypko + dalle2
なかなかクオリティが高い、CrypkoはGANで高品質の2Dキャラクターの立ち絵が生成できるサイトです。
GAN系を使って、組み合わせればかなりいいやつが現状でもできますね。
https://crypko.ai/
#midjourney (背景) + #Crypko (上半身) + #dalle2 (下半身)
— たちつてと (@noritama241) September 7, 2022
画像透過というか人物切り抜きツールはそらへんの適当なやつなのでやや粗いが(ので人力要素は何もない) pic.twitter.com/JZcwcUy3FM
リアルレンダリングへの簡単なヒント
Midjourneyでのリアルなレンダリングのためのコツについて記載されている方がいました。以下引用です。
![](https://assets.st-note.com/img/1662593029690-t4S0qsytsH.png?width=800)
異なるライティングタイプを組み合わせることで、現実の写真に近いフォトリアリズムレンダリングを実現できることが分かりました。そのために使ったのが、エピック、シネマティック、ドラマティック、ボリューミーなライティングです。さらに、顔、目、髪、体のレンダリングを細かく指定します。ボディを細かくレンダリングすることで、手が消える問題も多少は解決できる。また、肌の色をオリーブ色や褐色などに指定することもできます。肌の色の代わりに国籍を指定すると、キャラクターの民族性は変わりますが、外見は変わりません。また、スカーフをつけると、よりエレガントでワルな印象になりますね。)
Prompt:
Calming beautiful + geek gothic woman Nordic + cyberpunk tactical soldier combat engineer, olive skin, silver blue titanium camo patterns, finely detailed modern army armor, finely detailed face, finely detailed hair, finely detailed body, finely detailed eye, camo scarf, long wavy hair, character design, photography, octane render, dramatic lightings, epic lighting, cinematic lighting, volumetric lighting, unreal engine, intricate details, extremely detailed, very high details, photorealistic, hi res, hdr, uhd, fiery, hyper detailed, ultra realistic, vibrant, centered, in frame, real, --no gun, --s 2800 --ar 16:9 --testp --creative --upbeta --upbeta
Stable Diffusion 髪の毛のInpaintingの検証
キャラクター生成にはもってこいですね。大量に生成できてしまう。
![](https://assets.st-note.com/img/1662592716699-xqISlOnNd4.png?width=800)
分かりやすいtext2imghd
以前紹介したStable Diffusionで生成した画像の画質を遥かにアップするテクニック、text2imghdを分かりやすく解説してくださっている方がいるのでメモ。
思想・ムーブメント
深津さんインタビュー公開。
深津さんの投稿がバズってからみんなMidjourneyを触り始めた気がします。分かりやすく画像生成AIの現状、今後、社会への影響などについて語られています。
ヴィラン作品を本にしようと考えているけどどうかな?
この日刊でも以前紹介させていただきましたが、kingmyda82さんは以前からヴィランの作品をよく投稿されていました。
![](https://assets.st-note.com/img/1662591593272-cQfjQpqs9L.png?width=800)
![](https://assets.st-note.com/img/1662608345872-2zNOKiy4kk.png?width=800)
![](https://assets.st-note.com/img/1662608348184-5jSptN0c13.png?width=800)
![](https://assets.st-note.com/img/1662608360225-6LYtMxyqpA.png?width=800)
![](https://assets.st-note.com/img/1662608362885-pseukoje8R.png?width=800)
LatentSpaceの怪談
ネガティブプロンプト(テキストから画像を生成するわけではなく、AIがなるべくプロンプトと違う画像を作成しようとするもの。)を使うと、なぜか謎の恐ろしい老婆が現れるという話。
🧵: I discovered this woman, who I call Loab, in April. The AI reproduced her more easily than most celebrities. Her presence is persistent, and she haunts every image she touches. CW: Take a seat. This is a true horror story, and veers sharply macabre. pic.twitter.com/gmUlf6mZtk
— Supercomposite (@supercomposite) September 6, 2022
![](https://assets.st-note.com/img/1662621925259-FQ3OLyR5Vv.png)
最後に
昨日も研究、開発が沢山進んでいますね。気付いてない部分でもっと研究されている方々がいると思うのでもうちょっと深ぼってチェックしたいです。
Twitterに、毎日製作したものや、最新情報、検証を載せているのでよかったらフォローしてね
次の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます