見出し画像

日刊 画像生成AI (2022年11月21日)

ジェネレーティブAI界は、今とても早いスピードで進化し続けています。

そんな中、毎日時間なくて全然情報追えない..!って人のためにこのブログでは主に画像生成AIを中心として、業界変化、新表現、思考、問題、技術や、ジェネレーティブAI周りのニュースなど毎日あらゆるメディアを調べ、まとめています。

"Latent Space"


過去の投稿はこちら


📣お知らせ
ジェネレーティブAIで取り組みたい事業があり現在進めています
Webアプリケーション開発ができ今後一緒に取り組める方を探しています。
言語, 環境: AWS, React native, Python, Flutter, …など
もし興味がありましたら、TwitterでDMをいただけますと幸いです🙇


開発


あるふさんがパブリックドメインしか使っていないイラスト向け超解像モデル「HAT-CC-0」を公開

あるふさんがパブリックドメイン画像しか学習に使っていない、イラスト向け超解像モデルが先出しで公開!


NVIDIAから「Magic3D」を公開

たかにゃしりょうさんが説明を書かれていたのでメモです
NVIDIAからtext-to-3Dが発表です。


Synthwave/Outrun スタイルを使えるモデルが公開


カッティングシートモデルが公開

https://www.reddit.com/r/StableDiffusion/comments/z0xyk2/dreambooth_model_for_cutting_machines/


Clone Warsモデルが公開

https://www.reddit.com/r/StableDiffusion/comments/z18vg4/i_made_a_clone_wars_model_hugging_face_in_comments/


Ghibli Diffusionが公開

https://www.reddit.com/r/StableDiffusion/comments/z17mdv/new_release_dreambooth_model_finetuned_on_classic/

活用した事例があったのでメモです、インペインティングを利用しているからこういうのが描けているそうですが、ぱっと見分からなくてすごい。
Nijijourneyに関しては割と」一発でこういうの出せたりするのでよりすごい


Emoji Diffusionが公開

https://www.reddit.com/r/StableDiffusion/comments/z14v7u/emoji_diffusion_stable_diffusion_finetuned_to/


Render Diffusion

単眼2D監視のみを用いて学習可能な3D生成・推論用の初の拡散モデル「RenderDiffusion」が発表! 単眼3D再構成、3D-aware inpainting、無条件生成に利用可能とのこと。3DのInpaintingとかワクワクすぎる

各拡散ステップでシーンの3D表現を生成しレンダリングすることで、従来の2D拡散モデルに3D構造を導入しています

EG3Dより性能がいいらしいです


SimulacraBot

SimulacraBotというのがあり、stablediffusionを使用して画像を生成し、他のユーザーが作成した画像を評価して、人間の美的嗜好のパブリック ドメイン データセットを作成するプロジェクトらしいけど現在は閉じられています。


Riveraが公開

けんすうさんが関わったNovelAIを搭載しているかもしれない無料画像生成AIサービスRiveraが存在しているようです。
(うみゆきさんのいくつかのツイートのリツイートと投稿で確認。)
現在は使用しないものとなっています


WebUIエクステンション集、LexiKrea、Depthmap、training-picker

うみゆきさんがWebUIのエクステンションをいくつか投稿されていたのでとても参考になったので拝借、LexiKreaという生成画像検索サイトのLexica、Kreaからプロンプトを持ってこれるエクステンションがあるみたいです。

こちらは、MiDaSで深度マップ生成できるようです。
こんなに今WebUIのエクステンション増えているんですね、いつの間に

動画から学習用画像を引き出してくれるエクステンション。


画像1枚からできるNerfが発表

学習時に複数のビューを利用することなく、1枚の物体画像からSDFパラメータ化された3次元形状、姿勢、外観を復元するものとのこと。すごい


Ask4Help

現在AIエージェントは性能上がってきているけどプロダクトレベルじゃない、それらを埋めるために人間の支援を要求し、その利用することを可能にするAsk4Helpポリシーの提案。

(bioshokさんが説明してくださっていたのでメモ)


表現


AIでゲーム制作してみた

Stable DiffusionやMidjourneyなどで作られた画像素材で作られたゲーム。5時間で制作されたようです


852話さんのAI漫画 


Nijijourneyの凄さがどんどんあらわに

(とほがえるさんの作品全て素敵なのでおすすめです!)


研究


Eagleが生成画像管理に適切..?

ただ、中に入っているプロンプトが表示できないという点があらしいので、そこを解決できるサービスあればいいかもしれない。


Stable Diffusion を使用してランダムなゲーム アート アセットを作成する方法 (チュートリアル)


1500以上の形容詞、副詞、間投詞、名詞、前置詞、動詞がテストされました! コメント内のリンク


写真のようにリアルな高解像度のポートレートを作るワークフロー


思想・ムーブメント


Unstable Diffusion

ついにGigazineさんがUnstable Diffusion取り上げてました


Futurist「【前編】10年後、世界はSFになる<AIエージェント(一般化知能)の実現」

bioshokさんが登壇されています、とても重要なことをまとめられているのでぜひ。


勉強


【ソニー社内講演】拡散モデルと基盤モデル


Huggingface タスクページ

あらゆる機械学習のデモ、ユースケース、モデル、データセットがまとまっているみたいです。


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます