日刊 画像生成AI (2022年10月18日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
過去の投稿はこちら
ピックアップニュース
Stability AIがサンフランシスコで発表イベント, 打ち上げパーティーを開催。
先日1億ドルを調達したStabilityAIがサンフランシスコでプレゼンテーションを開催。Emad氏かっこいい。
ツイートに大事な発表だけ部分だけピックしました。他は既に発表されていたりTwitterでもよく見る情報だったり、別事業の話だったりなので一旦飛ばしています。もっと知りたい方はフルでどうぞ。
ツイートで書いてないので大事めなことでいうと、100のPhDに資金を提供し、彼らのクラスターは AWS 上の4000のA100であるとのこと、来年は5 倍から10 倍に成長したいとのこと。いいなぁ、混ざって作りたい。
podcastもあったのでもっと知りたい方はこちらもどうぞ、
ちょっとまだ聞けていない。あとで聞きます。
開発
新しい画像編集技術「Imagic」
新しい画像編集技術「Imagic」が公開。テキストで画像編集を行います。Photoshop作業が一瞬で終わる..。すごい。
例えば鳥の写真に「a bird spreading wings」と入れるとちゃんと羽を広げてくれる。オウムの写真に「Two kissing parrots」と入れるとちゃんと二匹がキスしている。すごすぎ。
ワンショットで生成するより、ひたすらこれで生成された画像の一部を修正し続けることができれば大きな問題を解決できそう、素晴らしい解決策。colabノートブック公開されているからやってみよう。
imagic実装のノートブックはここにあります。
どうやらDreamBoothとembedding最適化の組み合わせらしい。
あと、この後すぐ今日補足11GBで動くやつをShivam Shirao氏が実装されていました。
こちら19日ですがbirdMan氏がブログを書かれていたので一緒に記載しておきます!
Memeplex.appが1枚あたり0.5円の企業向け低価格プランを展開。
無料でStableDiffusionや他公開されているモデルも使える清水亮さんのMemeplexがついにマネタイズを開始。いち早く実装されていたので出力データや検証プロセスのデータもさぞかし溜まっている点は大きい差別化になりそう。
Stable Diffusion for UE5
Unreal Engine5用 Stable Diffusionプラグインを開発するプロジェクトがあるようです。まだコードは未公開ですが、早期アクセスはもうすぐ公開とのこと。オープンソースっで自由に使えるとのことです。これによりUE5はもう単なる3Dツールじゃなくなるとのこと。UEもそろそろ触ろうかな
TrinArt、プロンプト最大文字数が1000文字に拡張
WebUI by AUTOMATIC1111の裏技
Generativeボタンを右クリックでGenerate foreverを選べば止めるまでずっと同じ状態で生成を続けてくれるらしい。裏のコード書き換えて1000枚とか出力するやつしか知らなかった..。
WebUI by AUTOMATIC1111用スクリプト StylePileが公開。
複数のプロンプトをまとめて1単語のボタンになっていて、それを選べば自動で後半にそのプロンプトが追加されるとのこと。関数化みたいだ。
Common Sense Machines
これ画像生成AIじゃないですが..すごかったので紹介。
スマホで回転させて手に持っててもちゃんとNeRFで生成できるっぽい。
表現
Outpaintingで横長画像生成→デプスを求めてHoudiniで立体化シリーズ
Saito Akiraさんのデプスを求めて立体化するシリーズがOutpaintingでずっと続いているので紹介。めちゃめちゃ綺麗..。
ファンタジー表紙風魔法使い
描画うま過ぎてやばい。SDとアニメモデル(おそらくwaifuか、novel)を50/50ブレンドでinpaintingを多用して作られているようです。
修復のプロセスはこちらにまとまっていました。
複雑なAIアート生成プロセスは他にもこの日こちらに紹介されていたので貼っておきます。
"都市のシーン"
これもすごく上手い、複雑に画像生成するようにプロンプトを設定して、Real-ESRGANとSD upscaleで生成している系ですね
深津さんの顔のバリエーション資料生成の検証
DALL-E生成画像を連番でAEで使用。
高速で切り替えればこういう複雑な生成画像でも有効そうでいいですね。
今日のAIアニメーションセレクト
違和感のないスタイル維持ができているSDのvideo2videoのスタイル変換。どうなってるんだ..。何かで画風完全固定して..とかできるのかな。ワークフローはまた公開してくれるみたいです。楽しみ。
研究
元素法典 日本語訳
さいPさんがまとめられていました。ぜひ!
Blenderの素材としてのNovelAI活用
いつも技術検証+美しい検証をされていろんなSNSで発信されてるHirokazu YokoharaさんのNovelAI活用実験。パーツとしての画像生成AIは現状でも余裕で威力を発揮するので使うのはこういう場面がやはり一番いいですね
なんでCodeformerの手版ないねんという話
顔を修正するCodeformerはあるがなぜ手はないのかという話、そもそも優れたてのデータセットが大量に存在しないらしい。一方顔は高品質のデータセットが大量にあるとのこと。手だけでも数百、数千枚必要らしいけど作れないのかな
Docker for Windowsで話題のDreamfusion(Text to 3D model)を動かしてみた
ノイズを入れたらいいらしい。
思想・ムーブメント
絵師さんが大変なことに..
絵師さんが普通に描いたのにこのプロンプトなんですか?とか生成のやり方とか連絡くる事例が起こっているようです、何件か見ました。
NovelAIで間違ってケーキ化されて泣いている女の子を生成してしまった例がバズる
Midjourneyの頃からたまに見かけていましたが多いですが人によっては好きみたいです。僕はちょっと苦手..です。
GitHub Copilotがあなたのオープンソースコードを無断で使用しても、あなたは気にしないかもしれません。しかし、Copilotがあなたのオープンソースコミュニティを消してしまったら、あなたはどう感じるでしょうか?
StableDiffusionと似たテキストからコード生成するAIは、同様に人々が訴えているらしい。この法的結果がSDに関連する可能性があるとのこと。
画像生成AIについての言及についての言及についての言及についての言及
CGへの扉 Vol.43:AI絵師は3DCGの領域へ | モリカトロンAIラボ
元素法典に関するtoggetter
NovelAIが盛り上がっているのはアジア圏
この日の気になるツイート
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。
画像生成AIの実験, 最新情報のまとめはこちら
過去の号はこちら
次の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます