日刊画像生成AI (2022年10月18日)

2022年10月19日 22:09

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

そんな中、毎日時間なくて全然情報追えない..！って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。

次の日に投稿するのが一番いいと思ったのでを先出ししています。
メインページの日付順が崩れますが正しい順番はマガジンにどうぞ
遅れた間の日付分は毎日少しずつ公開していきます。

過去の投稿はこちら

ピックアップニュース

Stability AIがサンフランシスコで発表イベント, 打ち上げパーティーを開催。

先日1億ドルを調達したStabilityAIがサンフランシスコでプレゼンテーションを開催。Emad氏かっこいい。

ツイートに大事な発表だけ部分だけピックしました。他は既に発表されていたりTwitterでもよく見る情報だったり、別事業の話だったりなので一旦飛ばしています。もっと知りたい方はフルでどうぞ。

ツイートで書いてないので大事めなことでいうと、100のPhDに資金を提供し、彼らのクラスターは AWS 上の4000のA100であるとのこと、来年は5 倍から10 倍に成長したいとのこと。いいなぁ、混ざって作りたい。

昨日サンフランシスコでStability AIの発表会があったので大事な所だけ抜粋してメモ残します。

まず、Dream Studio Proの予告（1/5）
解説はスレッドに記載。https://t.co/K8TEaV7V09
— やまかず (@Yamkaz) October 19, 2022

podcastもあったのでもっと知りたい方はこちらもどうぞ、
ちょっとまだ聞けていない。あとで聞きます。

@infiniteL88ps氏がが登場
Stability AIの創業者兼CEOのEmad氏に聞いてみましょう。
サンフランシスコで開催された華やかなローンチパーティーに続き、私がなぜこんなに夢中になっているのか。
.
一言で言えば、彼は完全にオープンなAi！の旗手であり、ビーコンである。

🚨BONUS @InfiniteL88ps is up🚨

Following a spectactual launch party in San Francisco, you might want to listen why I'm so enamored of @EMostaque, founder and CEO of @StabilityAI.

In a phrase, he is the standard bearer and beacon for a totally open Ai!https://t.co/0s7RZbPe5R
— Jim OShaughnessy (@jposhaughnessy) October 18, 2022

pic.twitter.com/Ld8O2itzs4
— Emad (@EMostaque) October 18, 2022

開発

新しい画像編集技術「Imagic」

新しい画像編集技術「Imagic」が公開。テキストで画像編集を行います。Photoshop作業が一瞬で終わる..。すごい。

Imagic: Text-Based Real Image Editing with Diffusion Models

Demonstrates, for the very first time, the ability to apply complex (e.g., non-rigid) text-guided semantic edits to a single real image using Imagen.https://t.co/s4y6mxd5Q1 pic.twitter.com/JKHKlVAsOu
— Aran Komatsuzaki (@arankomatsuzaki) October 18, 2022

例えば鳥の写真に「a bird spreading wings」と入れるとちゃんと羽を広げてくれる。オウムの写真に「Two kissing parrots」と入れるとちゃんと二匹がキスしている。すごすぎ。

ワンショットで生成するより、ひたすらこれで生成された画像の一部を修正し続けることができれば大きな問題を解決できそう、素晴らしい解決策。colabノートブック公開されているからやってみよう。

Got Imagic running with Stable Diffusion, it's super easy to implement, will share a notebook soon!

Left: Input image, Right: Edited "A photo of Barack Obama smiling big grin" https://t.co/out24YVESD pic.twitter.com/WWvoNxqjOB
— Justin Pinkney (@Buntworthy) October 18, 2022

imagic実装のノートブックはここにあります。

As promised here's the notebook implementation in by Stable Diffusion fork: https://t.co/K5CGouxSQP

This might work with the pesser or CompVis versions too. Note it will require >24GB of RAM and takes around 5 mins on an A100. (Obviously I got mine from @LambdaAPI!)
— Justin Pinkney (@Buntworthy) October 18, 2022

どうやらDreamBoothとembedding最適化の組み合わせらしい。

The combination of #dreambooth and embedding optimization paves the way to new image editing capabilities. Love it. Congrats on this nice work! https://t.co/DC04hoTBrY
— Kfir Aberman (@AbermanKfir) October 18, 2022

あと、この後すぐ今日補足11GBで動くやつをShivam Shirao氏が実装されていました。

I implemented Imagic training in 11 GB VRAM with diffusers, and also working in colab free tier.
Code: https://t.co/VNgqPc6UEX
Colab: https://t.co/ndIHAKnxfW #stablediffusion #ai #Imagic #aiart pic.twitter.com/52SeWiIwdv
— Shivam Shrirao (@shivamshrirao) October 19, 2022

こちら19日ですがbirdMan氏がブログを書かれていたので一緒に記載しておきます！

巷でやべーと話題のImagicについて、解説記事を書きました！
ソースコードを読みながら手法を理解できますhttps://t.co/QScd7cT5OX
— birdMan (@birdMan710Nika) October 19, 2022

Memeplex.appが1枚あたり0.5円の企業向け低価格プランを展開。

無料でStableDiffusionや他公開されているモデルも使える清水亮さんのMemeplexがついにマネタイズを開始。いち早く実装されていたので出力データや検証プロセスのデータもさぞかし溜まっている点は大きい差別化になりそう。

Stable Diffusion for UE5

Unreal Engine5用 Stable Diffusionプラグインを開発するプロジェクトがあるようです。まだコードは未公開ですが、早期アクセスはもうすぐ公開とのこと。オープンソースっで自由に使えるとのことです。これによりUE5はもう単なる3Dツールじゃなくなるとのこと。UEもそろそろ触ろうかな

https://www.reddit.com/r/unrealengine/comments/y7angm/project_dream_is_coming_ue5_stable_diffusion/

TrinArt、プロンプト最大文字数が1000文字に拡張

【TrinArt】
WebUI記法使用時に字数が足りなくなることがあるため、プロンプトの最大文字数を1000文字に拡張しました。#trinart #ainovel
— Bit192 Labs 【AIのべりすと / Tone Sphere】 (@_bit192) October 18, 2022

WebUI by AUTOMATIC1111の裏技

Generativeボタンを右クリックでGenerate foreverを選べば止めるまでずっと同じ状態で生成を続けてくれるらしい。裏のコード書き換えて1000枚とか出力するやつしか知らなかった..。

https://www.reddit.com/r/StableDiffusion/comments/y6su8s/secret_option_in_automatic1111s_web_ui_not_really/

WebUI by AUTOMATIC1111用スクリプト StylePileが公開。

複数のプロンプトをまとめて1単語のボタンになっていて、それを選べば自動で後半にそのプロンプトが追加されるとのこと。関数化みたいだ。

Common Sense Machines

これ画像生成AIじゃないですが..すごかったので紹介。
スマホで回転させて手に持っててもちゃんとNeRFで生成できるっぽい。

何これ？blenderと組み合わせたNeRFハイブリッドレンダリングとかも書いてる。なんか急速にCG分野にAIが入ってきている https://t.co/aipqyl6Efe
— Hirokazu Yokohara (@Yokohara_h) October 18, 2022

表現

Outpaintingで横長画像生成→デプスを求めてHoudiniで立体化シリーズ

Saito Akiraさんのデプスを求めて立体化するシリーズがOutpaintingでずっと続いているので紹介。めちゃめちゃ綺麗..。

#StableDiffusion でOutPaintingを実装し横長画像を生成。Boosting Monocular Depth Estimation Models to High-Resolution via Content-Adaptive Multi-Resolution Mergingでデプスを求め #Houdini で立体化。ループ処理を実装。 pic.twitter.com/KQco3NOTl4
— Akira Saito (@a_saito) October 17, 2022

ファンタジー表紙風魔法使い

描画うま過ぎてやばい。SDとアニメモデル（おそらくwaifuか、novel）を50/50ブレンドでinpaintingを多用して作られているようです。

https://www.reddit.com/r/StableDiffusion/comments/y6w26g/fantasy_cover_style_magic_users/

修復のプロセスはこちらにまとまっていました。

複雑なAIアート生成プロセスは他にもこの日こちらに紹介されていたので貼っておきます。

(1/9) Friends! Today I want to share with you some details of the process of creating AI art. This tweet is for collectors, and who want to know what #AIArtwork looks like. pic.twitter.com/fsJ1HwDj59
— Olena speakingtomato (@speakingtomato) October 18, 2022

"都市のシーン"

これもすごく上手い、複雑に画像生成するようにプロンプトを設定して、Real-ESRGANとSD upscaleで生成している系ですね

https://www.reddit.com/r/StableDiffusion/comments/y6mkmx/city_scene_sd_upscaled/

深津さんの顔のバリエーション資料生成の検証

気づいたけど、最初にAIで「顔バリエーション資料」を出して、それから作品を錬成すれば、一貫性を安定して出せるな。マンガや創作の一次資料にAIを使うのは、ポジティブな使い方なのではないか。#NovelAI pic.twitter.com/lbVI7moLXW
— 深津貴之 / THE GUILD / note.com (@fladdict) October 18, 2022

AI画像生成の課題だった、再現性のあるオリキャラ作成。安定して仕組み化できたので、次の実験に進む。#NovelAI pic.twitter.com/DjARoQHHdw
— 深津貴之 / THE GUILD / note.com (@fladdict) October 18, 2022

絵をポン出しするのではなくて、「一次ブレスト（AI）」→「バリエーション模索（AI）」→「資料集（AI）」をやって、そのあとに「AI画像生成」か「手描き」か「AIと手描きの混合か」を決めればよい感。

こういう使い方なら、既存の漫画家、イラストレーター、デザイナーもポジティブにAIを使える。
— 深津貴之 / THE GUILD / note.com (@fladdict) October 18, 2022

DALL-E生成画像を連番でAEで使用。

高速で切り替えればこういう複雑な生成画像でも有効そうでいいですね。

⚠️点滅注意⚠️
DALLE2で生成した画像を連番にしてAfterEffectsの時間置き換えエフェクトを適用してみた
⚠️点滅注意⚠️ pic.twitter.com/D7ZVch4KaE
— Sugar_mgx (@Sugar_mgx) October 18, 2022

今日のAIアニメーションセレクト

違和感のないスタイル維持ができているSDのvideo2videoのスタイル変換。どうなってるんだ..。何かで画風完全固定して..とかできるのかな。ワークフローはまた公開してくれるみたいです。楽しみ。

stable diffusion smooth video init + style test #stablediffusion pic.twitter.com/jMNJA95XI5
— Nicolai NightVision (@NicolaiNightVi1) October 17, 2022

どうしてこんなに安定した実写→アニメ化ができてるんですかね？未来からやってきたのか？　→RT
— うみゆき@AI研究 (@umiyuki_ai) October 19, 2022

研究

元素法典日本語訳

さいPさんがまとめられていました。ぜひ！

Blenderの素材としてのNovelAI活用

いつも技術検証＋美しい検証をされていろんなSNSで発信されてるHirokazu YokoharaさんのNovelAI活用実験。パーツとしての画像生成AIは現状でも余裕で威力を発揮するので使うのはこういう場面がやはり一番いいですね

画像生成AIでアニメ世界の雑誌の表紙を生成。それをBlenderで配置。秒で生成されるからこういったメインではない使い方かなり有効だ。NovelAIのポイントまだ残ってたから問題になりにくい使い道を考えてた pic.twitter.com/V1GgfWL2nZ
— Hirokazu Yokohara (@Yokohara_h) October 17, 2022

なんでCodeformerの手版ないねんという話

顔を修正するCodeformerはあるがなぜ手はないのかという話、そもそも優れたてのデータセットが大量に存在しないらしい。一方顔は高品質のデータセットが大量にあるとのこと。手だけでも数百、数千枚必要らしいけど作れないのかな

Docker for Windowsで話題のDreamfusion(Text to 3D model)を動かしてみた

記事を投稿しました！ Docker for Windowsで話題のDreamfusion(Text to 3D model)を動かしてみた [Unity] on #Qiita https://t.co/byVr39zLm5
— Aster@DreamFusionに沼り中 (@Beehibiki) October 17, 2022

ノイズを入れたらいいらしい。

img2imgの使い方に気づいてしまった
絶対に欲しい要素以外をRGBノイズにしてimg2imgに入れると、そこそこの確率で近い構図＋背景を生成してくれます。素材はトリミングした写真でもOK
noising strengthは1にするのがコツ。ぜひお試しください#stablediffusion pic.twitter.com/pSQ7TVOKZx
— SUZUKI Yuiko (@JungleCrow33) October 18, 2022

思想・ムーブメント

絵師さんが大変なことに..

絵師さんが普通に描いたのにこのプロンプトなんですか？とか生成のやり方とか連絡くる事例が起こっているようです、何件か見ました。

※PIXIVに絵をアップする際は『他のユーザーによるタグ編集を受け付けない』にチェックを入れたほうがいいです。
➡入れないと「Novel AI」ってタグを勝手に付けられて「AIで描いたんですか！？」っていうコメントがきまくり地獄と化します。
タグ消してもNovel AIで文字検索したら表示は残るようです
— はまけん。🐈 (@twdshamano) October 18, 2022

NovelAIで間違ってケーキ化されて泣いている女の子を生成してしまった例がバズる

Midjourneyの頃からたまに見かけていましたが多いですが人によっては好きみたいです。僕はちょっと苦手..です。

AIの絵、人間と違ってちゃんと指示しないと予想外の方向性に突き進むからね
これはcake,cryingだけで生成させて出てきた奴 pic.twitter.com/TzQvT1pfQE
— すたブル子＠AI絵師お題箱開設中！ (@1513_Ai) October 18, 2022

首から下をケーキ化されて泣いてる女の子
これだよ求めていたものは
人間がまだ試したことがない組み合わせの特殊性癖を総当りで発掘　どんどんやってくれ
— 窓口基👽3巻発売中/窓口まい (@MADOguchimoto) October 18, 2022

GitHub Copilotがあなたのオープンソースコードを無断で使用しても、あなたは気にしないかもしれません。しかし、Copilotがあなたのオープンソースコミュニティを消してしまったら、あなたはどう感じるでしょうか？

StableDiffusionと似たテキストからコード生成するAIは、同様に人々が訴えているらしい。この法的結果がSDに関連する可能性があるとのこと。

画像生成AIについての言及についての言及についての言及についての言及

CGへの扉 Vol.43：AI絵師は3DCGの領域へ | モリカトロンAIラボ

元素法典に関するtoggetter

NovelAIが盛り上がっているのはアジア圏

海外の方の投稿で知ったんですがNovelAIは主にアジア圏で盛り上がっているようです。Google Trendsで「NovelAI」で調べたら日本は4番、アメリカは11番目。中国が圧倒的。https://t.co/THCzkSpk0B pic.twitter.com/fV4a9Y9c2T
— やまかず (@Yamkaz) October 17, 2022

この日の気になるツイート

このままテクノロジーが進化していくと色んな職業は統合されて「世界を作ることが未来の仕事になる」って記事を一年半前に書いたけど、画像生成AIが流行った今ならもう少し納得してもらえる気がする。

世界の創り方（前編）https://t.co/uQ0qTG9x5R
— 佐藤航陽 🌎 著書「世界2.0 メタバースの歩き方と創り方」 (@ka2aki86) October 18, 2022

「心のないAIの描いた絵なんかで感動できるわけがない」という発言を見かけてグッときてしまった
初音ミクさんとボカロファンが10年前に辿った道やぞ
— greenspa (@greenspa) October 18, 2022

これ、古典的なフレーム問題での命題、爆弾処理をするロボット　と同じですね。そこに到達したかとも言えるなあ https://t.co/HCTstRwWep
— Shigekazu Ishihara (@shigekzishihara) October 18, 2022

「Novel AIでできないこと」を理解するために、Novel AI触ってみてるけど…CrossAttension Layerスゴイな。ちゃんと既存絵がGoogle画像検索で引っかからないものを作れてる。「手はポケットい入れてしまう」というズルを見つけた pic.twitter.com/RMuipMiKi2
— 深津貴之 / THE GUILD / note.com (@fladdict) October 17, 2022

【AIイラストに特化したSkeb】作ったら需要ありますか？？

普通のイラストと違って「誰が作ったか」はあまり重要ではないので、依頼/報酬はコンペ方式もしくは山分け方式

依頼者は、低コストで中クオリティのイラストが欲しい人を想定

参加者は、AIイラストの題材がほしいAI絵師を想定
— KIKO | AI絵師 (@KIKOAINFT) October 18, 2022

今後AI規制派が優越すれば、""元素法典""は""禁書""指定されて、その""呪文""を使うユーザーは""魔女""認定されてインターネット""火炙り""にされるってこと？

もう最高じゃないですか、こういうインターネットをずっと待ってたんですよ
— ((☛(ひわい)☚)) (@blu_you) October 18, 2022

アカウント開設から72時間で1万人フォロワー達成！！
ありがとうございます！！

1つネタバラシすると、このアカウントのイラストは全て、NovelAIで生成した絵を、人間が加筆したイラストです！！

左が加筆後、右が加筆前のイラストです！#NovelAI pic.twitter.com/dTfyFICPlp
— 心緒ナツ (@kokoroonatsu) October 18, 2022

ヤン・ルカン氏が「ここ10年で、機械学習分野で最も興味深いアイデア」と言うレベル https://t.co/VpkKSlgzFY
— からあげ (@karaage0703) October 18, 2022

最終的には、画像生成AIは「言語で拾えない部分」をどう指定するか？が、真髄になるなぁ。そこで「AIで描ける人」と「AIに描かされる人」の違いがでそう。
それは下絵誘導、(){}記法のプロンプトウェイトやブレンド、確率的ガチャ、TIやDBやHN的なカスタマイズかもしれない。この辺が#novelai pic.twitter.com/xXlMcqkkub
— 深津貴之 / THE GUILD / note.com (@fladdict) October 18, 2022

最後に

Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

Tweets by Yamkaz

画像生成AIの実験, 最新情報のまとめはこちら

過去の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます

日刊 画像生成AI (2022年10月18日)