見出し画像

日刊 画像生成AI (2022年11月1日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開され、日々とても早いスピードで変化しています。

"New Entertainment"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


過去の投稿はこちら


開発


Midjourney V4がテスト中

Midjourney V4のランク付けのご協力のお願いがきています。4段階で評価をつけてみてねとのこと。あくまで最終状態ではなくテストってことだけどなんか全体的に忠実度が上がっている印象。「--testp、--test」感。以下テストで表示されたもの。

有料会員の人はここから参加できます


4つの異なる角度からのピクセルアートスプライトシートを生成できる「PixelArt_SpriteSheet_Generator」が公開

ピクセルアートシートでトレーニングされたStableDiffusionモデルが公開。
なんと言ってもこの崩れていない綺麗なピクセルがやばい。

モデルのマージする感覚が難しい。全身画像のDreamBoothモデルとかじゃないとそもそもうまくいかないとかかな。いくつかモデル混ぜてみたけど混ぜる比率が30%くらいで足が崩れてしまいました

ツイートに記載したのでこちら添付しておきます。

こちらから利用できます。


Few-Shot-Patch-Based-Trainingのcolab notebook

Izumi Satoshiさんがimg2imgした数枚のキーフレームからスムーズな動画を生成できるFew-Shot-Patch-Based-TrainingのColabノートブックを書かれていたので紹介。気になる


デジタルアセットマーケットプレイス「Creative Fabrica」がジェネレーティブAIツールの提供を開始

中国、アメリカなどの素材サイトは続々とAIツールを搭載している印象、新興勢力にそれで戦って負けたら嫌だから搭載しちゃおうって考えていそう


NovelAI Tag Experiments

これ知らなかったのですが、NovelAIのプロンプトがいっぱい載っているサイトがあるみたいだったのでメモしておきます。


表現


852話さんのNovelAI img2imgアニメーション

ネガティブプロンプトで「3D」を使い、強めていくと平面イラストになるのですが(前852話さんが発見されてた)それをimg2imgを使ってMMD動画をimg2imgで置き換えられている動画が話題になっていました。クオリティがめちゃ高くて素敵。


AIアニメーションをMusic Festivalで

カリフォルニアのオークランドで開催されたSecond Sky Music Festivalで、Deforum Stable DiffusionのAIアニメーションがライブに使われているようです。最近TikTokでもたまに見かけるようになってきたので知ってる人が増えてきている感じがします。


"An anarchic dystopia"

クオリティの高い素敵なSDアートが公開されていたので紹介。

https://www.reddit.com/r/StableDiffusion/comments/yiovaq/an_anarchic_dystopia/


研究、検証


DiffusersベースでStableDiffusionのモデル(U-Net+Text Encoder)をfine-tuningする

KohyaさんがDreamBoothのスクリプトの応用で、fine-tuningをする方法についてまとめられています。やってみたい方はぜひ。


Promptia マガジンの創刊号が公開

スタイル、チュートリアル、およびAIで作成されたアートに関する情報が満載の 94 ページのpdfが公開。AIアートもっと深めたいぜって方はいいですね

こちらのdriveからダウンロードできました。https://drive.google.com/file/d/19cA42-CiYrW6OIytDUeJa2j-Ya467ttw/view

公式サイトはこちら

紹介されていた方のReddit


Platさんの魔術書にカメラ効果が追加

PlatさんのNovelAIの魔術書にカメラ項目が追加されていたのでメモ。たくさんまとめられているのでおすすめです。


「アーティスト名」単体指定じゃなくて、「by アーティスト名」は本当に効果あるよという話

プロンプトでアーティスト名を指定する場合、単体で指定するよりも明らかにbyを使った方がそのスタイルが適用されるという事がたくさんの実験から分かったという話。おそらくアーティスト単体だと学習時にその人の顔や他のランダムな画像も、(インタビューとか他の人のブログの画像とか..?)混ざっているから良くないのかもしれない。


思想・ムーブメント


海外で「Prompt Battle」が開催

特定の課題に従って完璧な画像を生成するバトル、「Prompt Battle」が開催で開催されたようです。例えば「好きなペットと食べ物のミックス」、「OpenAIは、あなたが生成した画像を所有することを好まないでしょう」など、大喜利っぽい?観客が審査し、部屋を横切って勝者の背後に立つように移動する。AIはDALL-E2が利用されているとのこと。

これ普通に誰か興味ある人いたら一緒にやってみたいかも..。渋谷のどこか借りたりしてやったら人来るかなぁ

調べたら次は11月16日開催らしいです。詳しくはサイトにどうぞ


Scale AIのイベントでStability AIのEmad氏が対談

Scale AIのTransform Xのイベントのセッションで、Stability AIのEmad氏がAIの民主化、StableDiffusionについて話されています。10月23日に既に公開されていたみたいです、またちゃんと見れていないので後で見ます。


「OpenAI CEO Sam Altman | AI for the Next Era 」について + 翻訳

OpenAIの代表のSam Altmanさんの対談動画の解説、翻訳をうみゆきさんがまとめられています。この動画ずっとみたかったのですが見れていなかったのでとても助かります

動画はこちら

テスラの元AI責任者Andrejさんのポッドキャストもうみゆきさんがまとめられていたので一緒に紹介させていただきます。こちらはまだ見れていないです、また見ます


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます