見出し画像

日刊 画像生成AI (2022年10月19日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"激動の予感"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


過去の投稿はこちら


開発


Adobeがついに動く。

様々なAIが誕生する中Adobeがどうするのか注目されていたと思います。そんなAdobeが画像生成AI開発に踏み込むようです。倫理や法律面などで透明性を持つ画像生成AIツール開発するとのこと。もしかしたらStability AIと契約を結んでいる説もある..?

調べたら動画ありました、AdobeMAXで話されていたようです。どうぞ。
うーんどういう仕組みにするのか全く予測できない。Adobeはただクリエイターの仕事を奪うものは作らないという立場のようです。

"私たちは、クリエイター中心の観点からジェネレーティブテクノロジーにアプローチしています。AIは人間の創造性を高めるべきであり、それに取って代わるものではないと考えています。"

@dwadhwaniは創造性、責任、技術の交差点に対するアドビのビジョンを #AdobeMAX で共有しています。

今のところAdobeExpressというのが近日公開予定らしく、その中にgenerative aiでのフォント作成があるみたいなのと..
(これ面白そう)

時間を変えたり、季節を変えたりできるのも例として出されていたみたいです。これらはAdobe Stock Libraryから学習したAdobe Senseiによってもたらされているらしい。もう決まった時間に撮影とかいうプロセスも無くなったらめっちゃ便利だ。

他の紹介されていた例
写真の影の移動
コンピューターで生成された空と照明で時刻を変更する
口頭のプロンプトに基づいて新しいデザインとコンテンツを作成する
春から冬への季節の移ろいを写​​真で
人が写っている新しい写真を作成する、AI で作成された人

https://photofocus.com/featured/adobe-embraces-generative-ai-but-at-what-cost-to-creatives/

基調講演はここで見れます、どうぞ


UniTune: 単一の画像で画像生成モデルを微調整することによるテキスト主導の画像編集

UniTune は、入力として画像(1枚)と画像編集の説明を受け取り、入力画像に対する高いセマンティックおよび視覚的忠実度を維持しながら編集を実行するもの。img2imgと一緒じゃん!となりそうなところですが、よくみるとimg2imgでは影響が消えてしまいそうなところまで残っているように感じる。高度なimg2imgのような感じでしょうか。モデルとしてはimagenを利用しているが、他のモデルでも動くように期待しているということです。



RunwayMLからinpainting用StableDiffusionモデルが登場

RunwayMLがStabilityからの資金提供で新しいモデルを公開。AI動画編集ツールを作っているRunwayからinpainting用のSDモデルが登場、果たして何が違うのか..

以下のディスカッション曰く、最大の違いはDDIMサンプラーに追加された十数行のコードらしい。使ってみた方のコメント2人見たのですが、普通のSDよりかなり質が高くinpaintingできるらしい。おそらくAI動画編集ツールのRunwayでは高画質動画の編集をしたりするからそのために高度なinpaintingの開発が必要だったのかもしれない。


Stable Hordeがモデル変更とimg2imgに対応

Stable Diffusion ワーカーのクラウドソーシングによる分散クラスタ、つまり無料で画像生成できて、みんなの力が合わさってできているSD、「Stable Horde」。久しぶりに使ってみたら人が増えてきたのか初期の速さは無くなっている印象でした、というか全然生成できなくなっていた。そのSHがimg2imgとモデル変更にまで対応。

https://www.reddit.com/r/StableDiffusion/comments/y7f53n/stable_horde_now_supports_img2img_and_a_new/


元素法典一点五卷 —— Novel AI 元素魔法全收录

NovelAIの高レベルなプロンプト集、元素法典のver1.5が出たらしいです。



Krea.aiの対話型UIが形になってきている件

生成画像検索サービス、Lexica.artと競合サービスの中でもいいサービス、Krea.aiが対話型UIをずっと開発されていて、形になってきているそうです。


Gradioにストップボタンがつくみたいです。


Stability AIが5408個のA100を所有したようです

どんどん所有数が増えてきている。おめでたい。


Public PromptsにMicroWorlds DreamBoothモデルが登場

有料でpromptを販売するpromptbase.comを許せないサイト製作者の方が高クオリティのプロンプトやdreamboothを無料で公開していく活動、public promptsに今日もモデルが登場。今日はこういうやつ


Midjourney Style Libraryが更新

38人の画家とイラストレーター、14 人の写真家、数人のデザイナーと建築家、5つの新しい芸術的技法、ファッションデザイナー向けセクションを追加したとのこと。合計673個。かなり質の高いスタイルライブラリになってきた。

https://www.reddit.com/r/midjourney/comments/y7dv0j/81_new_samples_in_the_midjourney_styles_library_a/


表現


NovelAIで逆に唱える

ネガティブプロンプトにまとめて突っ込んだらどういうことになるかということだと思います。本当に全く逆になってる。色も逆位相のオレンジだし、ムキムキになってる。


NovelAIでラーメンを食べる女の子を生成するのが流行っているらしい


AIアニメーションセレクト

この日は豊作です、上2つのAIアニメーションのクオリティはなかなかないので素晴らしいです。DreamBoothで学習したモデルで作られているのもあります。


神の設計図シリーズ


綺麗な手がSDで出せないからイライラして壊れた手をバケツに入れた画像を生成した

https://www.reddit.com/r/StableDiffusion/comments/y7lncw/tried_to_generate_a_good_hand_for_hours_got/


爆発するボムヘイの動画

動画を撮影して、ロトスコープを作成してからSDで実行したらしい。(Deforumのvideo inputでやっていそうです)


研究


Imagic解説記事や、検証

昨日も貼りましたが今日も紹介。AI画像編集ができる強力なImagicについて詳しくbirdMan氏が解説されています。是非

かわいい。


NovelAIをSeed値を固定して差分画像を作る方法

NovelAIの基本操作、img2imgのnoteを書かれていたかりみやさんがseed値を固定して差分画像を作る方法を公開されています。分かりやすい。


Hypernetworksのレイヤー構造を変えた際の変化を検証する


思想・ムーブメント


ポッドキャストで、Emad氏がゲスト出演で語った話

昨日stability AIの発表会と同時に紹介していた動画の翻訳版を海行さんがアップされていましたので紹介。(海行さんがなぜか前のアカウント凍結されてしまったので、今こちらのアカウントで活動されています。)


Stable DiffusionのGitHubのスター数面白い

縦にほぼ垂直に伸びてるの面白すぎる。


朝日新聞のAI画像生成についての記事。
852話さん、清水さん、柿沼さんにインタビュー


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます