見出し画像

日刊 画像生成AI (2022年10月25日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開され、日々とても早いスピードで変化しています。

"new system"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


過去の投稿はこちら


ピックアップニュース


Shutterstockから画像生成AIのビッグニュース

OpenAIのDALL-E2を自社サイトに統合。
モデルのトレーニングに関与した画像を持つクリエイターに収益の一部を受け取る収益分配補償モデルを開発し、Contributor Fundを設立。
(含まれるコンテンツとメタデータの量に比例)

過去にもShutterstockはOpenAIにデータを販売しているようで、これからもっといいshutterstock特化モデルのようなものを作る流れもありそう。
あと基金のシステムがどういうものなのかとても気になる。
どういう計算で、どのくらい配分されるのか、今後注目したいところ。
もし一枚0.5円で生成だとしてもその生成データの学習に使われたデータは大量にあるはずなので0.0.. いくらくらいしか貰えないんじゃないかと思っているんですがどうなんでしょうか。単にこういうものを作っておけば叩かれにくくなるという対策な気もしてしまったりします。


開発


Visualize.aiの Visualize Studioがv1.1 にアップデート

公式はDreamStudio、日本だと、清水さんのmemeplexやmihoさんのstablediffusion.click、APIだとお絵描きばりぐっどくんなどのSDが使えるサービスが10数個存在していますが、その中の一つ、Visualize.aiが無料、無制限の 512x512/64 ステップの実行(Nvidia A100)をサポートしたようです。プロンプトマーケットプレイスと統合されているのが他との違いですね


Sygil.dev と Project Nataili の発表

今後全てのSDプロジェクトの中心となるSygil.devとProject Natailiが発表されました。 Project Nataili は、すべての人が使用できる一般的なStable Diffusion バックエンド。(コードのライブラリのようなものっぽい?)オープンソース ライセンスが付与されており、可能な限り使いやすいようにコードがリファクタリングされているようです

現在のStableDiffusionプロジェクトのほとんどはAutomatci1111氏かhlky氏のコードに基づいて作られていますが2ヶ月で成長しすぎて、繰り返されるスクリプト、文書化されていない関数、作成者だけが読める非効率的なメソッド、UIに紐づけられていて使いにくいものが沢山登場したため、このようなプロジェクトを立ち上げられたようです。


Deforum for WebUI by AUTOMATIC1111

https://www.reddit.com/r/StableDiffusion/comments/ychq1x/the_official_deforum_script_for_2d3d_stable/

AIアニメーションが作れるDeforumをStableDiffusionの中でも1番有名な実装、AUTOMATIC1111にタブとして追加するスクリプトが登場。


DreamBoothがついに..

進化が続くDreamBooth。DreamBoothは一応説明しますと、少ない枚数で新しい概念を学習させ、モデル全体に影響を与えるというもの。現在DreamBoothは複数の概念(数百)をクラス画像なしで 10 分未満で再トレーニング可能なモデルでトレーニングできるようになったそうです。モデルが壊れたり乱れることもないようです。すごい。
(ただあまりうまくいかないとの声もあります)


NovelAIのプロンプトを管理・調整するChrome拡張「NAI_magic_wand」公開

DALLE2のビルダーのChrome拡張はありましたがあれは専用だったのでこれは嬉しい。プロンプト保存機能とエディタ機能(順番を気軽に変えたり、強調も簡単にできるみたいです)もあるようです。

かみくだくさん
NovelAIめちゃ楽しいんですがプロンプトの細かい調整をしたい時、"あの"入力フォーム内で頑張って順番変えたり、強調の数を変えるのが辛すぎました。そして折角いい感じになったプロンプトを毎回スプレッドシートに保存するのにもしんどさがありました。
というわけでVue3の勉強がてら、自分がとりあえず最低限欲しい機能を持ったChrome拡張を作りました。

https://qiita.com/hassoubeat/items/1750ed03dcae82630396


StableDiffusion 1.5が利用できるDEMO, コードを公開。

DiffuserライブラリでSD1.5を利用するデモとコードが公開されていたのでメモしておきます。気軽に試してみたいって人はここから試せますのでぜひ。


以前話題になっていたAIアニメーションのコードが公開

スムーズすぎて少し話題になったAIアニメーションがあり、この方がコードは今後公開すると言われていたのですが公開されたようです。中身はあまりまだ見れていないのですが、興味ある方はぜひ


表現、研究


SD 1.5がかなりいいらしい

SD 1.5は十分にトレーニングされたモデルのため、CFGスケールを通常より上げることができるようでこのクオリティに辿り着くことができるようです
この方はSD ema 1.5 Ana De ArmasのDreamBoothを使っているようです。もうMidjourneyの生き物系の出力の質とかなり近くなってる

https://www.reddit.com/r/StableDiffusion/comments/ycpy7f/i_installed_automatic1111_today_and_i_feel_like/

なお、このDreamBoothモデルについてですが20 枚以上のポートレート ショット、少なくとも 4 回の中距離胴体ショット、少なくとも 4 つの長距離全身ショット、少なくとも 1 回の着席ショット、焦点が合ったネイティブの高解像度画像が必要で、Dreambooth モデルの多様性を高めるには、さまざまな環境、照明、ヘア スタイル、表情、ポーズ、角度、被写体からの距離の画像が必要とのこと。こちらにまとめられています。


Robo-Diffusionめちゃめちゃかっこいい..

StableDiffusionをロボ画像で微調整したRoboDiffusionで高品質な出力をしている方がいたのでメモ。めちゃめちゃかっこいい。

https://www.reddit.com/r/StableDiffusion/comments/yd3n30/i_can_run_this_robot_prompt_247_and_get_kick_ass/

prompt:
nousr robot hyper realistic cyborg fluid close up ornate details doe female eyes volumetric lighting subtle glows, 4k

Robo-Diffusionはこちら


NovelAIで映画ポスター生成の検証


画風・スタイルの呪文(NovelAI)

ひたすらNovelAIを検証して、呪文をnotionにまとめられているPlatさんがこの日も公開されていました。


思想・ムーブメント


AIは表現のどこにいるのか

NovelAIでシンプルなイラストレーション、特殊表現をしばらく研究されたsabakichiさんがブログでまとめられています。

https://domaindesign.co/column/where-is-ai-in-expression/


Bleeding edge

AI系で、時系列で注目すべき論文や出来事がまとめられていて便利なサイト bleeding edge。sangminさんが紹介されていて良かったので紹介。


ゲーミング〇〇〇は合法か否か

(noteがアダルト用語を書くと18禁扱いになってしまうので今後〇〇表記になります。)NovelAIで生成した「ゲーミング〇〇〇」というのが流行っていましたが、とりあえず合法らしいです。


Ghelia Monthly~イラストレーターとAI【1】/AIは「安倍吉俊」にはなれない(ゲスト:安倍吉俊氏)

清水亮さんがイラストレーターの安倍吉俊さんと画像生成AIについて対談されています。


この日の気になるツイート

特定アーティスト生成派閥、それらに対抗するアーティスト派閥は海外でも発生しているようです。

コンセプト
- 特定のアーティストの作品を、スタイルセレクターでAIが微調整(例:Greg Rutkowski、現在AI世代に人気)。
- UIには、そのアーティストの普段のギャラも表示されます。
- AIアートを生成するたびに、UIに「AIを使うことで890ドル節約できました!」と表示される。

このような概念にこそ、私たちは対抗しなければならないのです。

-著作権のない素材で構成されたデータセットを要求する。
-私たちの作品のパワーと所有権を取り戻しましょう。AIモデルからの脱却を可能にする。
-データセットが使用されたアーティストに報酬を支払う。


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます