日刊画像生成AI (2022年11月23日)

やまかず

2022年12月7日 23:39

ジェネレーティブAI界は、今とても早いスピードで進化し続けています。

そんな中、毎日時間なくて全然情報追えない..！って人のためにこのブログでは主に画像生成AIを中心として、業界変化、新表現、思考、問題、技術や、ジェネレーティブAI周りのニュースなど毎日あらゆるメディアを調べ、まとめています。

過去の投稿はこちら

ピックアップニュース

画像生成AIアドベントカレンダー✨

あるふさんが制作された画像生成AIアドベントカレンダーがあります！
僕も後半に登録しました。と言っても何書くか決まっていないので何しようかな…という感じですが、何かしら有効な記事書きます

アドベントカレンダーが埋まりません！助けてください！残りを全部埋めるのはしんどいのです！(一人アドベントカレンダーをやった並の感想 https://t.co/5YJr54FYlN
— あるふ (@alfredplpl) November 23, 2022

開発

voltaML-fast-stable-diffusionが公開

わずか１行のコードで、TensorRT モデルにモデルを変換でき、2.5倍の加速がA100 NVIDIA GPUで見られるようです。T4とA10でテストしたところ、速度は約 60%しか向上しませんでしたとのこと。ただ生成物が変わってしまうとのこと。DreamBoothモデルは試してないよとのこと。

discordはこちら

Fantasy-Card-Diffusionが公開

約 35,000個のカスタムタグ付き「Magic: the Gathering 」のアート作品でトレーニングされた包括的なモデル「Fantasy-Card-Diffusion」が公開

https://www.reddit.com/r/StableDiffusion/comments/z2j2v1/fantasycarddiffusion_comprehensive_model_trained/

100を超える言語に対応した最初の text2image モデル Kandinsky 2.0が公開

https://www.reddit.com/r/StableDiffusion/comments/z2rfut/new_kandinsky_20_multilingual_text2image_latent/

デモページ

後からたかにゃしさんの投稿で知ったんですが、ロシアの銀行「Sberbank」が作っているみたいです。銀行…？お金で戦える分野だったりするから、自分たちでもう作っちゃえ！ってことなんでしょうか。

ロシア最大の銀行「ズベルバンク（Sberbank）」が画像生成AI「Kandinsky 2.0」を発表（拡散モデル）。100言語以上を対象としてる。多言語テキストエンコーダには「mCLIP-XLMR」と「mT5-small」を利用。スパコン「Christofari」で学習。196 A100で14日（65,856 GPU時間）で学習https://t.co/I4huz1VZVJ pic.twitter.com/CDQnMrnUtr
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) November 24, 2022

Few-Shot Fine-Tuningで作られたパーソナライズされたSDモデル「Discoo Diffusion」が公開

ベクターアイコンを生成できるモデルを製作中..

https://www.reddit.com/r/StableDiffusion/comments/z2qnsl/created_a_tool_to_generate_unique_svg_app_icons/

Stable Diffusion for Photoshop by CantrellがInpaintingとCLIP ガイダンスを大幅に改善

Version 0.7.2 of the @StableDiffusion @Photoshop plugin brings dramatically improved inpainting and CLIP guidance. Both are automatic. You can override the diffusion engine if you want, but by default, the plugin will use the best engine for the task.https://t.co/gqFWpABQLY pic.twitter.com/krRvnfu7xH
— Christian Cantrell (@cantrell) November 22, 2022

dbluthモデルが公開

Dragon's Lair、Space Ace、Dragon's Lair Time Warp から 3 つの異なるモデルをトレーニングし、それらをマージしたdbluthモデルが制作。

数ショットのfine-tuningでパーソナライズされたStableDiffusion

人間を模倣した AI ボーカルを含む 1,000 以上の曲が、中国の Tencent Music によってリリース

表現

"Selfie at the end of the world"

制作方法について記載がありましたがここまでモデル混ぜて作るの初めて見ました、（HassansBlend1.3+1.4+F222+NAI） For anatomyモデル - Elysium V1 + Elysium_Anime V2 + NAI - SD 1.5 inpaintingモデルと、SD 1.5 標準モデルと、この人のオリジナルのMEGA MERGE V21（21個の統合モデル）で作られているらしい。出力めっちゃ綺麗！

Nijijourneyの出力物凄すぎる

AI 無編集#midjourny の二次元版AI #nijijourney のポップでキュートなキャラ出力がめちゃくちゃすごい pic.twitter.com/fmobvdVxGu
— 852話 (@8co28) November 23, 2022

縦長レイアウト最高っすね#nijijourney #aiart pic.twitter.com/WgquLrDHcr
— とほがえる (@tohofrog) November 23, 2022

AI 無編集#midjourney の二次元版AI #nijijourney のクオリティがすごい pic.twitter.com/KwvkNiZGlZ
— 852話 (@8co28) November 23, 2022

NovelAIで10000万生成して作ったWebコミック

https://globalcomix.com/c/paintings-photographs/chapters/en/1/14

MMD動画→AIでアニメ化（3Dモデルを絵として学習）

自作MMD動画の作画アニメ化、3Dモデルを絵としてAIに学習させる手法を試してみたけど中々良さそう！ pic.twitter.com/n1dckfJYyH
— mobiusP📸 (@mobiusP) November 23, 2022

研究

MagicPony: Learning Articulated 3D Animals in the Wild

単一視点画像のみを使用し、異なる視点からの写真を与えなくても、形状、アクチュエーション、視点、テクスチャー、照明の3次元シェイプを推定することができる手法が発表。従来手法と比較して、抽象的な図面や人工物の3D再構成に優れた汎化性を示すとのこと。

EDICT: Exact Diffusion Inversion via Coupled Transformations

拡散プロセスの計算時間を2倍になるけど、元の画像構造を維持したまま、幅広い画像の編集が可能とのこと。

EDICT: Exact Diffusion Inversion via Coupled Transformations
abs: https://t.co/ZEp7BMwHcR pic.twitter.com/D8tINShOOe
— AK (@_akhaliq) November 23, 2022

SinDiffusion: Learning a Diffusion Model from a Single Natural Image

単一の画像から拡散モデルを学習する方法。既存のGANベースのアプローチと比較して生成されるサンプルの品質と多様性が大幅に向上。

SinDiffusion: Learning a Diffusion Model from a Single Natural Image
abs: https://t.co/QKjWuhWwWH pic.twitter.com/PCtZjSRcB6
— AK (@_akhaliq) November 23, 2022

Google Colab ではじめる Stable Diffusion 1.5

思想・ムーブメント

ビッグテックはA.I.の大型モデルを独占していないが、NvidiaはA.I.のハードウェアを支配している。

AI画像コンテスト実行委員会がNovelAIの開発者インタビュー! 質問を募集中

（もう終わってます、ごめん😢）

📌アンケート

先日告知した通り、AI画像展の企画の1つとして、NovelAIの開発者の方へのオンラインインタビューが決まりました🎉

そこで、皆さんから質問を募集します！
NovelAIの開発者の方に聞いてみたいあんな事やこんな事を教えてください！https://t.co/z551m1k41U
— AI画像コンテスト実行委員会 / 集計&展示会準備中 (@AI_contest) November 23, 2022

あなたの指先で無限の創造性を描く

人工知能は現在、ほとんどの人間よりも優れたアートを作成できます。すぐに、これらの驚きのエンジンは、ほぼすべての設計方法を変革します。

My prediction: not a single human artist will lose their job to AI artists. My reasoning: https://t.co/hxDSHQ3gOb
— Kevin Kelly (@kevin2kelly) November 22, 2022

人工知能が新しい物理法則を発見することはあるのでしょうか？

最後に

Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

Tweets by Yamkaz

画像生成AIの実験, 最新情報のまとめはこちら

過去の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます

日刊 画像生成AI (2022年11月23日)