見出し画像

日刊 画像生成AI (2022年9月17日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"開放されたマルチバースへの扉"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


昨日までの投稿はこちら


開発


Grokking SD 日本語版

tomo-makesさんが先週紹介したGrokking Stable DiffusionというStable Diffusionの仕組みをわかりやすくしたcolab notebookを日本語訳されました。めちゃめちゃ最高です。

基礎編(part1)

Textual Inversion編(part2)


CHARL-E公開 (Mac用 シンプルなインストーラー)

自分がMacユーザーなのでインストールして使ってみました。シンプルすぎて細かく設定できる機能もまだないのでこれからかなぁという感じです。ただデザイン性が高いので応援したい。ここまでシンプルなインストーラーのは、Diffusion Bee以来ですね。このクールさを保って大量に機能追加していってほしい。


getimg.ai公開

Webで利用できるStable Diffusionのサービスが乱立してますね..サービスとして認識してる限り7個くらいありますが、気づかれてないものを含めるともっとありそう。

https://www.reddit.com/r/StableDiffusion/comments/xgkj9c/made_yet_another_image_generation_website_try_it/

利用してみましたが、過去生成物の履歴が見えたりするのはいいですね。
この戦いは激アツですね..。


ClipMatrix

これは論文自体はNikolay Jetchevさんがかなり前に出されていたようですが、Emadさんがリツイートされていたのでシェア。ClipMatrix を使ってテクスチャ付きの 3D メッシュを作成してくれるというもの。

ClipMatrixの論文はこちら


研究


布留川さん(npaka) WebUI, Docker 解説記事

Stable Diffusionの今最も機能が豊富な実装 WebUI (AUTOMATIC1111)のDocker版「Stable Diffusion WebUI Docker」を使ってWindowsにインストールされています。Colabで毎回やっている方はぜひ。


Waifu Diffusionかなりすごい..

いややばいですね..草さんのこの検証かなりレベル高いので要チェックです。
今まで見た生成されたイラストの中で一番クオリティが高いかもしれないです。


Stable Diffusionにdanbooruデータセットを追加学習する。


Waifu Diffusion × Textual inversion

Birdmanさんが開放されたのでメモしておきます。Waifu DiffusionをTextual inversionすると既存のイラストレーターさんのイラストをかなりレベルの高い状態で扱えるというもの。Birdmanさんは高度な検証をとても多くされているので要チェックです。


表現


MidjourneyとDall-E2で作られた立体都市をめぐるWeb

めちゃめちゃ楽しいのでこのサイト是非見てください。Midjourney を使用して約140、Dall-E 2 を使用して約30のアセットを作られたそうです。いやこれいいな..。ドラッグでこの空間を移動するの楽しすぎる。


Fish Pendulum

img2imgでペンデュラムを魚にしている動画。面白かったのでメモ。

https://www.reddit.com/r/StableDiffusion/comments/xftuo9/fish_pendulum/


AIAnimationセレクト

良かったAIアニメーションを毎日セレクト。今日はこちら。前半のはかなりレベルが高いです。アニメーションを複数生成して繋げられているらしいです。スタート地点をimg2imgなどで一致させたりされているんでしょうか。
どんどん制作物のレベルが上がってきていてすごい。


思想・ムーブメント


Greg Rutkowski の人気は 2 倍になりました。

Promptとして利用されてる確率が高すぎるGreg Rutkowskiさんの検索率が増えているそうです。今後データとして学習させる派、させない派みたいになってくると思うのですが、思いつきですが逆に学習させることで知名度を上げる..という方法もあるのかもしれません。

https://www.reddit.com/r/StableDiffusion/comments/xgn66f/greg_rutkowski_is_now_twice_as_popular_i_wonder/


『We live in a society』

切ないイラストですね。Redditで昨日トップを飾っていたのでメモ。個人的にはAIを駆使してさらに強化されたイラストレーターがガンガン出てくると思っているので、こんなことにはなるのはもう少し先の話な気がしています。ただ、変化できないとこうなってしまいそうですね。


DALL・Eの生成物を手書きに

アートブックにして販売したり、コンペに出したり、漫画にして販売したり、あらゆるこの事例はHandpaintingと書かれていたのでおそらく生成物から手書きしているかと思われます。

https://www.reddit.com/r/dalle2/comments/xgk3v3/handpainting_my_dalle_prompts/


勉強


注釈付きでモデルコードを見る。


Vision Transformer入門執筆の背景と書評


DDIMのわかりやすい解説, Annotation / PyTorch code

tomo-makesさんが紹介されていたのでシェア。


Stable Diffusionの構造

これもtomo-makesさん。


『Tensorflowは使われたい!(3)』

まっくすさんが仕組み解説を分かりやすく書かれたものを技術書展で出されていたのですがネットで既に販売されていたようです。
買ってみました。読むのが楽しみです。


『機械学習の吹いたん』

あとこちらも。深層学習、GAN、画像生成の歴史から、SDの原理まで書かれているそうです。こちらも買いました。tomo-makesさんが僕のことや、この日刊のことをmust readとして紹介してくださっているそうです。嬉しい。


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったらフォローしてくれると喜びます。

https://twitter.com/Yamkaz


前回の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます