![見出し画像](https://assets.st-note.com/production/uploads/images/87435303/rectangle_large_type_2_92b9c13142bc1cc93cfc751fa364e91b.png?width=1200)
日刊 画像生成AI (2022年9月21日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
![](https://assets.st-note.com/img/1663850671080-FxmPAkzpJy.png?width=1200)
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
昨日までの投稿はこちら
開発
DreamStudioがMasking, in-paintng, out-paintingを実装
We just dropped #stablediffusion 1.5 masking, in-painting, and out-painting in #dreamstudio!
— Conner Ruhl (@connerruhl) September 20, 2022
~> https://t.co/mmghkJVNxj <~
~> https://t.co/BJAnNrwP5s <~
It’s a lot of fun to play with!#stablediffusion #aiart pic.twitter.com/9f0KkkaFHH
使い方動画が上がっていました、こちらに。
MidjourneyがTile設定可能に
Midjourneyがプロンプトに「--tile」を指定すればタイル画像を生成できるようになりました。Stable Diffusionに追加された機能はどんどんMidjourneyにも追加されていくのでしょうか。楽しみです。
![](https://assets.st-note.com/img/1663850828697-8WJwGbXEFy.png?width=1200)
![](https://assets.st-note.com/img/1663850837861-2kLMiDiDXu.png?width=1200)
また、以下サイトにタイル画像をドラッグすればタイルにした時どんな感じが分かるとのこと。このパラメーターをいじるとタイルの大きさを変えることができます。タイル画像生成する際はマストですね。
![](https://assets.st-note.com/img/1663851007527-FYNrLnEc9C.png?width=1200)
Chinese Stable Diffusion
中国語版Stable Diffusionがリリース。中国語を入力して画像を生成できます。PaddlePaddleなので、中国Baiduが開発したということだと思います。以前話題になったERNIE-ViLGもここの開発したものですよね。
![](https://assets.st-note.com/img/1663853659033-pe3Iq5yPWu.png?width=1200)
ノードベースで機能を搭載しまくったWebUIが開発中。
現在開発中のおそらくリリースされたら最強に近いStable Diffusionが扱えるサービスが誕生予定。非常に応答性の高いwebgui を (無料でオープン ソースで) 実行し、サーバーを (自宅またはレンタルの vps) に向けるサーバーになると考えられているそう。生成して、その画像を使ってimg2imgしたりするときだったり、Loopbackで作るとき画像を参照したりするのが面倒ですが、このノードベースエディタならかなり制作が楽になりそう。あとよく見たら、video2videoとかtext2videoもある。Community Feed的な仕組みもあるといいなと期待。
![](https://assets.st-note.com/img/1663852377553-gZ5O5Bd2If.png?width=1200)
Prompt InPaintingが開発。
これまでは、ある人の服装を変えた画像を作りたいとなればその部分を塗りぶししないといけませんでした。でもこれがあればもうそれがテキストだけで終わります。素晴らしい開発。clipsegを使用して要求されたもののマスクを作成して、標準の img2img を使用してマスクされたもののコンテンツを上書きできるようにすることです。すごい!これめちゃめちゃ嬉しいですね。
New @Gradio Tutorial - Prompt Paint is a web app to upload your picture and change its content just from text prompt (this builds on my previous tutorial) using #stablediffusion inpainting!
— 1LittleCoder💻 (@1littlecoder) September 21, 2022
📀 - https://t.co/ZocEQCuSvs
📒 - https://t.co/h8saNWSXpu
<Inference time edited out> pic.twitter.com/HQh4TeX7lf
colab, githubはこちら。
また、http://avyn.com/ではすでにこれが実装されており、無料で使用できるとのこと。
Stable Diffusion 減算 (類推)ができるツール
プロンプトの足し算、引き算ができるやつは公開されていたと思うのですが、それと同じだったらすみません。これは2つのプロンプト A と B の差である X を計算し、X を別のプロンプト C に加算することによって行われる。例えば、男と女の差「X」を導くと、それは性別を表すので、その「X」を例えば男の王様の画像に適用すると女性になるということ。応用したらめっちゃいいですねこれ。
How to turn a King into a Queen? Or generate a female version of Mario, or a table?
— Yuguang (YG) Zhang (@ygantigravity) September 20, 2022
Made a tool playing with subtraction (aka analogy) in @StableDiffusion , where you can push any image to be more X (X can mean more feminine, masculine, or anything)
1/7#StableDiffusion #aiart pic.twitter.com/bEmuedoyRw
Diffusion UI開発
Stable Diffusion で画像を生成するための APIを制作されている方がいました。text2img、img2img、inpaintingができるとのこと。既にいっぱいあるので、差が分からないですがもしAPIを活用されてる方がいたらこちら確認必要かもです
![](https://assets.st-note.com/img/1663854528809-2CdvGmKs0q.png?width=1200)
Stable Diffusionのための巨大なクラウドソーシング分散クラスター
井口健治(needle)さんが呟かれていたので発見しました。強力なGPUを持たない人でも、コミュニティが提供する空き/アイドルリソースを利用してSDを利用することができるとのこと。
![](https://assets.st-note.com/img/1663855049995-tLe3DvaozO.png?width=1200)
表現
img2imgでパレイドリアを引き起こす。
Stable Diffusionのimg2imgを使えば元画像をプロンプトに寄せることができるんですが、そこでパレイドリア(普段からよく知ったパターンを本来そこに存在しないにもかかわらず心に思い浮かべる現象)が引き起こされる画像を実際にそのものにしちゃうという遊びをしている方がいました。面白い。
![](https://assets.st-note.com/img/1663852130192-2cHuBDkww9.png?width=1200)
![](https://assets.st-note.com/img/1663852134179-95bcxEtnrL.png?width=1200)
![](https://assets.st-note.com/img/1663852138506-4E8flwNcHv.png?width=1200)
各国のイメージでポケモンを作る
一昨日リリースされたText2pokemonを活用し、国の名前であらゆるポケモンを作られている方がいました。
![](https://assets.st-note.com/img/1663852250293-DMFDuqKM2k.png?width=1200)
磁性流体のAIアニメーション
これは素晴らしいですね..。AIアニメーションは風景やキャラクターでやってる人が多いですがこういう物理現象はすごくAIアニメーションと相性がいいですね。めちゃめちゃいいな..
"Ferro Fractals" abstract #stablediffusion animation in VoC using #DeforumDiffusion 0.3 - my orig. music - 5min / 4k version: https://t.co/q8phCWG87D #ai #AIart #aiartcommunity #ferrofluid pic.twitter.com/NhSDyFizgr
— DrewMedina (@DrewMedina20) September 20, 2022
終末世界の地下バンカーを歩いてみよう!
POPPINさんの映像作品がかなりよかったので引用させていただきました。
終末世界の地下バンカーを歩いてみよう!#Deforum#DeforumDiffusion#StableDiffusion#Aiart pic.twitter.com/APYb9GN4W4
— POPPIN (@POPPIN30521640) September 20, 2022
ちょっとこのカメラ移動の仕組み気になりすぎて..リプライ確認したところ、こちらを利用されているそうです。このカメラ移動はあまり見たことがなかったのですが、Blenderのカメラ操作をDeforumで使える値に変化してくれるそうです。なるほど..使ってみます!
この回転 × 風景はなかった
昨日の投稿されていた中でも注目があった作品。この回転でのAIアニメーションあまりみたことなくて面白い。
maybe it's time to stop and change your perspective pic.twitter.com/GRMNt3jo3V
— Artificial Bob (@ArtificialBob) September 21, 2022
Stable DiffusionでVJ
Touchdesigner、tidalcycle、Deforum Stable Diffusionの活用。こういうVJ作品作る方々徐々に増えてきてますね。
AIで作ったVJ動画素材に曲を乗せました。#stablediffusion を使った #deforum でVJ動画素材を複数作成し、組み合わせました。プログラミング不要で、テキスト入力(呪文)で十分実用的な素材が作れます。#vj #touchdesigner #ai #DeforumDiffusion #tidalcycles pic.twitter.com/UJMlt57wKP
— moistpeace (@moistpeace) September 20, 2022
研究・活用
DALL・Eを使用して、古い写真を修復する
![](https://assets.st-note.com/img/1663851753269-1KipN2CeZ8.png?width=1200)
Stable Diffusionで長いプロンプトの入れる際のテクニック
これプロンプトエンジニアになりたいという方は必須ですね。StableDiffusion自体は、CLIPに入力されて、埋め込みベクトルに変換されて、Diffusion Modelの画像生成に利用されるのですが、入力文章をトークナイザで意味のあるトークンに分割されるんですが利用できるトークンが75個までらしいです。なので、それを踏まえて有効なプロンプトを描くためのテクニックが紹介されています。素晴らしい記事です。
LOLNeRF 1枚の画像から3Dモデル生成
Googleが公開。ある1視点から見た画像から、3Dモデルを推定してくれるそうです。高精度に進化したそう。
![](https://assets.st-note.com/production/uploads/images/87441273/picture_pc_c938f2fe1896b522e81e51064b3bdcc0.gif?width=1200)
Text2Light
与えられたテキストから 4K+ 解像度の HDRI を生成してくれるそうです。リアルなレンダリングと没入型 VR の実現可能性が示されてます。
![](https://assets.st-note.com/production/uploads/images/87436041/picture_pc_20fc67be05fc260ad2dab74d49dc3a51.gif)
思想・ムーブメント
Getty Images / iStockが対応。
写真素材サイトのGetty Images, iStockは著作権の問題が解決されていないため、AI画像(stable diffuson, dalle2, midjourneyなどなど..)の受け入れを停止し、以前の提出物をすべて削除するとのこと。この動きは最後どういうところまで行くのか。
![](https://assets.st-note.com/img/1663852686515-410ajydOBf.png?width=1200)
Midjourneyで生成した画像でタロットカード作り
かっこいい。色指定や、質感のプロンプトは固定して、内容のプロンプトを変えられてるんだともいますが、こんな素敵になるんですね、いいなぁ。
![](https://assets.st-note.com/img/1663851949330-H2qnjcCq8x.png?width=1200)
創薬ちゃん生成チャレンジ終了
創薬ちゃんが企画していたコンペが終了。画像生成AIを使って創薬ちゃんっぽいキャラ絵を生成していた人が優勝というイベント。
#創薬ちゃん生成チャレンジ
— 叢雲くすり (創薬ちゃん) (@souyakuchan) September 21, 2022
結果発表!
応募者数は実に 54 名を数え、甲乙つけ難すぎたので授賞枠を増やした。
🥇¥20000 (1件)
🥈¥10000 (2件)
🥉¥5000 (4件)
準佳作 ¥3000 (6件)
他、参加してくれた全員に¥500 ずつ進呈する。順次 DM にてコードを送らせて頂く。
多くの御参加ありがとう! https://t.co/6CnVFjUi1M pic.twitter.com/ITnc5lLV82
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。よかったらフォローしてくれるとうれしいです。
画像生成AIの実験, 最新情報のまとめはこちら
前回の号はこちら
次の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます