日刊 画像生成AI (2022年9月3日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
昨日までの投稿はこちら
(いいねくれるとやる気がでます、どんどん見てくれる人増えて嬉しい。)
次の投稿はこちら
開発
NMKD Stable Diffusion GUI (windowsで簡単)登場
しばらくしたらmacでも出ると思いますね。現状のmacでのやり方は昨日紹介しました。
ただ、現状macでやると..、結構重いしPC熱くなるのであまり良くないです。AWSかGCPを検討してみましょう。僕はAWS慣れているので明日やってみます。
Deforum Diffuson v0.3公開
Inpainting機能、Masking機能も追加されました。深度ワープアニメーションまで実装されてえぐ強くなってる。かなり強くなってきました。
3D移動もできちゃうところがすごいです。
Textual inversion colab notebook
先日の号で紹介させていただいた二つの方法でやっていたのですが両方うまくいかず..だったので、少し調べたところ、textual inversionを実装したnotebookをdiscordで発見しました。僕は今テスト中です。
ERNIE-ViLG colab notebook
からあげさんがColabnotebookで使えるようにしてくださっていました。
Grokking Stable Diffusion
「Stable Diffusionを理解する」わかりやすく機能ごとに分けられて、それぞれ説明も書かれているcolabnotebookを作った人が現れました。
AI Text Prompt Generator
元のプロンプトに用意されてるいろんなOptionを追加したりすることができます。まだあまりいいね!って感じではないかな..? 今後に期待
研究
text2img→ESRGAN→img2imgで再描画→photoshop合成
数日前にもこのようなことをやってる方がいたので共有。超高解像度でディテールもある絵がこの技術を使えば可能になる。おそらくこれもしばらくしたらできるcolabnotebook出る。
前にやってる方がいたっていうのは、このtext2imghdです
Stable Diffusionからクールな画像を取得するための初級/中級ガイド
Deforum Diffusionで3D動画制作
makeitradさんの3D空間を彷徨うこの映像はすごいですね..美しすぎる。
この方よく色んなところで見かけるのでチェックしたほうがいいかもしれません。
Outpainting使用者続々
パースがずれる問題の指摘
デッサンと同じで、全体から書かず一部だけ書いてたら気づいたらずれてる..みたいなことがAIでも起こっているようです。この辺はStable Diffusionで人間を生成したときに顔が複数出ちゃう問題がありますが、v1.5で改善されているという投稿を見かけました。タイリング問題..って名前だった気がします。なのでいずれは改善されると信じてます。
Boothで素材配布
もう見えてないだけで結構いそうですが、Boothで素材配布を始めた人が現れました。先週ちょっと流行っていた、Tileable texture from Stable Diffusionを使われているそうです。
キャラクター4面図の生成
表現
Stable Diffusion is only the beginning.
感動…。覇王みたいな映像来ましたね。画像生成AIで生成された画像を使えばこんな素晴らしい映像が作れるんですね。
ネタ画像
よく猫でやっていた表現がハムスターでも置き換えたらウケるみたいですね。
キャラクター生成自動化
CEO詰め合わせ
マークザッカーバーグ、ビルゲイツ、ジェフベゾス、イーロンマスクの掛け合わせですね。Redditでも1位になって、Twitterでも伸びてます。
深度マップ生成 + stable diffusion + AfterEffects ディスプレイスメントマップ
この深度マップを求めるcolab notebookです。
思想・ムーブメント
DiscordでEmadに大質問会が夜中にありました。
気づいたら始まってて本当に少ししか参加できなかったので..日刊発行者としてはミスりましたね。超大型画像生成モデルの噂、Stabler、Stablest Diffusionの噂など、あと間違って聞いてしまってたらすみません。このようなことも言われてました。「今年はボトルネックになりそうですが、来年には緩和され、再来年には10億人がこのソフトを使うようになるので、一気に普及するでしょうね。」「複雑さの限界まで圧縮すると、何ができるようになるのか、非常に驚くことになるでしょう。そして今はまだほとんど最適化されていません。できることはたくさんあるのに、私たちはそれをやっていません。コミュニティ全体に協力してもらい、何千人もの素晴らしい開発者がこの問題に取り組んでくれています。」と話されてました。
録画とかもし見つけたら次の号で書きます。
あと、今日もあります。みんなチェックだー。
人類に残される最後の仕事
最後に
今日も特に開発の視点では大きな進歩はありませんでしたが、個人の研究や考察、表現の開発がまた進んでいます。
(この辺り情報足りてないとかありましたら、指摘してください。その部分も追って入れておきます)
Twitterに、毎日製作したアートや、最新情報、検証を載せているのでよかったらフォローしてね
https://twitter.com/Yamkaz
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます