日刊画像生成AI (2022年9月21日)

2022年9月22日 23:25

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

そんな中、毎日時間なくて全然情報追えない..！って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。

昨日までの投稿はこちら

開発

DreamStudioがMasking, in-paintng, out-paintingを実装

We just dropped #stablediffusion 1.5 masking, in-painting, and out-painting in #dreamstudio!

~> https://t.co/mmghkJVNxj <~
~> https://t.co/BJAnNrwP5s <~

It’s a lot of fun to play with!#stablediffusion #aiart pic.twitter.com/9f0KkkaFHH
— Conner Ruhl (@connerruhl) September 20, 2022

使い方動画が上がっていました、こちらに。

MidjourneyがTile設定可能に

Midjourneyがプロンプトに「--tile」を指定すればタイル画像を生成できるようになりました。Stable Diffusionに追加された機能はどんどんMidjourneyにも追加されていくのでしょうか。楽しみです。

https://discord.com/channels/662267976984297473/952771221915840552/1021879247360499804

また、以下サイトにタイル画像をドラッグすればタイルにした時どんな感じが分かるとのこと。このパラメーターをいじるとタイルの大きさを変えることができます。タイル画像生成する際はマストですね。

Chinese Stable Diffusion

中国語版Stable Diffusionがリリース。中国語を入力して画像を生成できます。PaddlePaddleなので、中国Baiduが開発したということだと思います。以前話題になったERNIE-ViLGもここの開発したものですよね。

ノードベースで機能を搭載しまくったWebUIが開発中。

現在開発中のおそらくリリースされたら最強に近いStable Diffusionが扱えるサービスが誕生予定。非常に応答性の高いwebgui を (無料でオープンソースで) 実行し、サーバーを (自宅またはレンタルの vps) に向けるサーバーになると考えられているそう。生成して、その画像を使ってimg2imgしたりするときだったり、Loopbackで作るとき画像を参照したりするのが面倒ですが、このノードベースエディタならかなり制作が楽になりそう。あとよく見たら、video2videoとかtext2videoもある。Community Feed的な仕組みもあるといいなと期待。

https://www.reddit.com/r/StableDiffusion/comments/xjrs2t/our_dream_gui_is_coming_together_nicely_we/

Prompt InPaintingが開発。

これまでは、ある人の服装を変えた画像を作りたいとなればその部分を塗りぶししないといけませんでした。でもこれがあればもうそれがテキストだけで終わります。素晴らしい開発。clipsegを使用して要求されたもののマスクを作成して、標準の img2img を使用してマスクされたもののコンテンツを上書きできるようにすることです。すごい！これめちゃめちゃ嬉しいですね。

New @Gradio Tutorial - Prompt Paint is a web app to upload your picture and change its content just from text prompt (this builds on my previous tutorial) using #stablediffusion inpainting!

📀 - https://t.co/ZocEQCuSvs

📒 - https://t.co/h8saNWSXpu

<Inference time edited out> pic.twitter.com/HQh4TeX7lf
— 1LittleCoder💻 (@1littlecoder) September 21, 2022

colab, githubはこちら。

また、http://avyn.com/ではすでにこれが実装されており、無料で使用できるとのこと。

Stable Diffusion 減算 (類推)ができるツール

プロンプトの足し算、引き算ができるやつは公開されていたと思うのですが、それと同じだったらすみません。これは2つのプロンプト A と B の差である X を計算し、X を別のプロンプト C に加算することによって行われる。例えば、男と女の差「X」を導くと、それは性別を表すので、その「X」を例えば男の王様の画像に適用すると女性になるということ。応用したらめっちゃいいですねこれ。

How to turn a King into a Queen? Or generate a female version of Mario, or a table?

Made a tool playing with subtraction (aka analogy) in @StableDiffusion , where you can push any image to be more X (X can mean more feminine, masculine, or anything)

1/7#StableDiffusion #aiart pic.twitter.com/bEmuedoyRw
— Yuguang (YG) Zhang (@ygantigravity) September 20, 2022

Diffusion UI開発

Stable Diffusion で画像を生成するための APIを制作されている方がいました。text2img、img2img、inpaintingができるとのこと。既にいっぱいあるので、差が分からないですがもしAPIを活用されてる方がいたらこちら確認必要かもです

Stable Diffusionのための巨大なクラウドソーシング分散クラスター

井口健治(needle)さんが呟かれていたので発見しました。強力なGPUを持たない人でも、コミュニティが提供する空き/アイドルリソースを利用してSDを利用することができるとのこと。

表現

img2imgでパレイドリアを引き起こす。

Stable Diffusionのimg2imgを使えば元画像をプロンプトに寄せることができるんですが、そこでパレイドリア（普段からよく知ったパターンを本来そこに存在しないにもかかわらず心に思い浮かべる現象）が引き起こされる画像を実際にそのものにしちゃうという遊びをしている方がいました。面白い。

https://www.reddit.com/r/StableDiffusion/comments/xk0v57/turning_pareidolia_images_into_reallife_versions/

各国のイメージでポケモンを作る

一昨日リリースされたText2pokemonを活用し、国の名前であらゆるポケモンを作られている方がいました。

https://www.reddit.com/r/StableDiffusion/comments/xjl2d7/each_country_as_a_pokemon_using_stable_diffusion/

磁性流体のAIアニメーション

これは素晴らしいですね..。AIアニメーションは風景やキャラクターでやってる人が多いですがこういう物理現象はすごくAIアニメーションと相性がいいですね。めちゃめちゃいいな..

"Ferro Fractals" abstract #stablediffusion animation in VoC using #DeforumDiffusion 0.3 - my orig. music - 5min / 4k version: https://t.co/q8phCWG87D #ai #AIart #aiartcommunity #ferrofluid pic.twitter.com/NhSDyFizgr
— DrewMedina (@DrewMedina20) September 20, 2022

終末世界の地下バンカーを歩いてみよう！

POPPINさんの映像作品がかなりよかったので引用させていただきました。

終末世界の地下バンカーを歩いてみよう！#Deforum #DeforumDiffusion #StableDiffusion #Aiart pic.twitter.com/APYb9GN4W4
— POPPIN (@POPPIN30521640) September 20, 2022

ちょっとこのカメラ移動の仕組み気になりすぎて..リプライ確認したところ、こちらを利用されているそうです。このカメラ移動はあまり見たことがなかったのですが、Blenderのカメラ操作をDeforumで使える値に変化してくれるそうです。なるほど..使ってみます！

この回転 × 風景はなかった

昨日の投稿されていた中でも注目があった作品。この回転でのAIアニメーションあまりみたことなくて面白い。

maybe it's time to stop and change your perspective pic.twitter.com/GRMNt3jo3V
— Artificial Bob (@ArtificialBob) September 21, 2022

Stable DiffusionでVJ

Touchdesigner、tidalcycle、Deforum Stable Diffusionの活用。こういうVJ作品作る方々徐々に増えてきてますね。

AIで作ったVJ動画素材に曲を乗せました。#stablediffusion を使った #deforum でVJ動画素材を複数作成し、組み合わせました。プログラミング不要で、テキスト入力(呪文)で十分実用的な素材が作れます。#vj #touchdesigner #ai #DeforumDiffusion #tidalcycles pic.twitter.com/UJMlt57wKP
— moistpeace (@moistpeace) September 20, 2022

研究・活用

DALL・Eを使用して、古い写真を修復する

https://www.reddit.com/r/dalle2/comments/xjsxtz/using_dalle_to_restore_an_old_damaged_photograph/

Stable Diffusionで長いプロンプトの入れる際のテクニック

これプロンプトエンジニアになりたいという方は必須ですね。StableDiffusion自体は、CLIPに入力されて、埋め込みベクトルに変換されて、Diffusion Modelの画像生成に利用されるのですが、入力文章をトークナイザで意味のあるトークンに分割されるんですが利用できるトークンが75個までらしいです。なので、それを踏まえて有効なプロンプトを描くためのテクニックが紹介されています。素晴らしい記事です。

LOLNeRF 1枚の画像から3Dモデル生成

Googleが公開。ある1視点から見た画像から、3Dモデルを推定してくれるそうです。高精度に進化したそう。

Text2Light

与えられたテキストから 4K+ 解像度の HDRI を生成してくれるそうです。リアルなレンダリングと没入型 VR の実現可能性が示されてます。

思想・ムーブメント

Getty Images / iStockが対応。

写真素材サイトのGetty Images, iStockは著作権の問題が解決されていないため、AI画像（stable diffuson, dalle2, midjourneyなどなど..）の受け入れを停止し、以前の提出物をすべて削除するとのこと。この動きは最後どういうところまで行くのか。

Midjourneyで生成した画像でタロットカード作り

かっこいい。色指定や、質感のプロンプトは固定して、内容のプロンプトを変えられてるんだともいますが、こんな素敵になるんですね、いいなぁ。

https://www.reddit.com/r/midjourney/comments/xjvbzw/printed_a_copy_of_the_tarot_deck_i_made_with/

創薬ちゃん生成チャレンジ終了

創薬ちゃんが企画していたコンペが終了。画像生成AIを使って創薬ちゃんっぽいキャラ絵を生成していた人が優勝というイベント。

#創薬ちゃん生成チャレンジ
結果発表！
応募者数は実に 54 名を数え、甲乙つけ難すぎたので授賞枠を増やした。

🥇￥20000 (１件)
🥈￥10000 (２件)
🥉￥5000 (４件)
準佳作￥3000 (６件)

他、参加してくれた全員に￥500 ずつ進呈する。順次 DM にてコードを送らせて頂く。
多くの御参加ありがとう！ https://t.co/6CnVFjUi1M pic.twitter.com/ITnc5lLV82
— 叢雲くすり (創薬ちゃん) (@souyakuchan) September 21, 2022

最後に

Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。よかったらフォローしてくれるとうれしいです。

Tweets by Yamkaz

画像生成AIの実験, 最新情報のまとめはこちら

前回の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます

日刊 画像生成AI (2022年9月21日)

開発