見出し画像

日刊 画像生成AI (2022年11月23日)

ジェネレーティブAI界は、今とても早いスピードで進化し続けています。

そんな中、毎日時間なくて全然情報追えない..!って人のためにこのブログでは主に画像生成AIを中心として、業界変化、新表現、思考、問題、技術や、ジェネレーティブAI周りのニュースなど毎日あらゆるメディアを調べ、まとめています。

"加速"


過去の投稿はこちら


ピックアップニュース


画像生成AIアドベントカレンダー✨

あるふさんが制作された画像生成AIアドベントカレンダーがあります!
僕も後半に登録しました。と言っても何書くか決まっていないので何しようかな…という感じですが、何かしら有効な記事書きます


開発


voltaML-fast-stable-diffusionが公開

わずか1行のコードで、TensorRT モデルにモデルを変換でき、2.5倍の加速がA100 NVIDIA GPUで見られるようです。T4とA10でテストしたところ、速度は約 60%しか向上しませんでしたとのこと。ただ生成物が変わってしまうとのこと。DreamBoothモデルは試してないよとのこと。

discordはこちら


Fantasy-Card-Diffusionが公開

約 35,000個のカスタムタグ付き「Magic: the Gathering 」のアート作品でトレーニングされた包括的なモデル「Fantasy-Card-Diffusion」が公開

https://www.reddit.com/r/StableDiffusion/comments/z2j2v1/fantasycarddiffusion_comprehensive_model_trained/


100を超える言語に対応した最初の text2image モデル Kandinsky 2.0が公開

https://www.reddit.com/r/StableDiffusion/comments/z2rfut/new_kandinsky_20_multilingual_text2image_latent/

デモページ

後からたかにゃしさんの投稿で知ったんですが、ロシアの銀行「Sberbank」が作っているみたいです。銀行…?お金で戦える分野だったりするから、自分たちでもう作っちゃえ!ってことなんでしょうか。


Few-Shot Fine-Tuningで作られたパーソナライズされたSDモデル「Discoo Diffusion」が公開


ベクターアイコンを生成できるモデルを製作中..

精度高い
https://www.reddit.com/r/StableDiffusion/comments/z2qnsl/created_a_tool_to_generate_unique_svg_app_icons/


Stable Diffusion for Photoshop by CantrellがInpaintingとCLIP ガイダンスを大幅に改善


dbluthモデルが公開

Dragon's Lair、Space Ace、Dragon's Lair Time Warp から 3 つの異なるモデルをトレーニングし、それらをマージしたdbluthモデルが制作。


数ショットのfine-tuningでパーソナライズされたStableDiffusion


人間を模倣した AI ボーカルを含む 1,000 以上の曲が、中国の Tencent Music によってリリース


表現


"Selfie at the end of the world"

制作方法について記載がありましたがここまでモデル混ぜて作るの初めて見ました、(HassansBlend1.3+1.4+F222+NAI) For anatomyモデル - Elysium V1 + Elysium_Anime V2 + NAI - SD 1.5 inpaintingモデルと、SD 1.5 標準モデルと、この人のオリジナルのMEGA MERGE V21(21個の統合モデル)で作られているらしい。出力めっちゃ綺麗!


Nijijourneyの出力物凄すぎる


NovelAIで10000万生成して作ったWebコミック

https://globalcomix.com/c/paintings-photographs/chapters/en/1/14


MMD動画→AIでアニメ化(3Dモデルを絵として学習)


研究


MagicPony: Learning Articulated 3D Animals in the Wild

単一視点画像のみを使用し、異なる視点からの写真を与えなくても、形状、アクチュエーション、視点、テクスチャー、照明の3次元シェイプを推定することができる手法が発表。従来手法と比較して、抽象的な図面や人工物の3D再構成に優れた汎化性を示すとのこと。


EDICT: Exact Diffusion Inversion via Coupled Transformations

拡散プロセスの計算時間を2倍になるけど、元の画像構造を維持したまま、幅広い画像の編集が可能とのこと。


SinDiffusion: Learning a Diffusion Model from a Single Natural Image

単一の画像から拡散モデルを学習する方法。既存のGANベースのアプローチと比較して生成されるサンプルの品質と多様性が大幅に向上。


Google Colab ではじめる Stable Diffusion 1.5


思想・ムーブメント


ビッグテックはA.I.の大型モデルを独占していないが、NvidiaはA.I.のハードウェアを支配している。


AI画像コンテスト実行委員会がNovelAIの開発者インタビュー! 質問を募集中 

(もう終わってます、ごめん😢)


あなたの指先で無限の創造性を描く

人工知能は現在、ほとんどの人間よりも優れたアートを作成できます。すぐに、これらの驚きのエンジンは、ほぼすべての設計方法を変革します。


人工知能が新しい物理法則を発見することはあるのでしょうか?


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます