見出し画像

日刊 画像生成AI (2022年11月11日)

ジェネレーティブAI界は、今とても早いスピードで進化し続けています。

そんな中、毎日時間なくて全然情報追えない..!って人のためにこのブログでは主に画像生成AIを中心として、業界変化、新表現、思考、問題、技術や、ジェネレーティブAI周りのニュースなど毎日あらゆるメディアを調べ、まとめています。

"革命..?"


過去の投稿はこちら


開発


Metaphor

ついに公開。生成AIに基づく検索エンジン「Metaphor」がついに公開されました。  生成AIで20年間変わらなかった検索の形が変わるかもしれない、そんな話が少し想像しやすくなるようなサービスが公開されました。

テキストに続く可能性が最も高いリンクを予測して表示してくれるもので、
例えば以下のようなことができます。通常の検索とは全く毛色が違い、ここでもプロンプトエンジニアリングは有力ですね

めちゃめちゃ昔..確か2ヶ月半前くらいにwaitlist登録があって、新しい検索エンジンを作るとか言われていて気になっていたけど忘れていたんですが、こういうものだとは思っていなかったです。使うページはこちらから

使い方などはこちら

ついでにこちらの記事もどうぞ
『次のGoogle検索エンジンはGenerative AIになる』



8つの画像を4秒で生成するDemoが公開

8つの画像が4秒で出力されるらしいです。
DPM-Solver++、TPU v2-8、JAXを利用することでStableDiffusionのHuggingfaceのデモは8つの画像が4秒で生成されるらしい。Demoページでも8秒くらいで4枚生成できてる。


RayCastにOpenAIの拡張機能が追加

ランチャーツール、RayCast(Alfredみたいなやつです)にOpenAIの拡張機能が追加されました。インストールしてOpenAIのAPI Key入れたら使えます、使ってみたんですが結構いいかもしれない。option+spaceでメニュー出して、DALL-E2やGPT-3でその場でプロンプト入力してすぐ生成できる感じです。

登録してみた、便利だよ


5,263人のアーティストスタイルで136,916枚の画像をレンダリングした

合わせて48 時間以上のレンダリング時間( 3080/4090)がかかったらしいです。ここからダウンロードできます。magnetリンクも同時に公開されています。

https://drive.google.com/file/d/1ojnD_bPa0jRIAYf_0RJSMCMEpSVcKgB4/view?usp=share_link


DreamBoothモデルを1カ所で見れるサイト、Civitai

https://www.reddit.com/r/StableDiffusion/comments/yrp2l8/we_made_a_tool_to_find_all_the_dreambooth_models/


Colossal-AI

モデルを高速かつ安価に学習・fine tuningする新しい方法が登場。

プレトレーニングのコストを6.5 倍、fine tuningのハードウェアコストを7 分の1 に削減すると同時に、プロセスをスピードアップする、完全なオープンソースのソリューション。


NovelAIDiffusionがアップデート Furry(Beta V1.2)に。

ケモノや人間以外のコンテンツをより良く生成できるらしいです。ケモノ好きの人には嬉しそう


Popup diffusionが公開

本から飛び出したような画像が生成できるモデルが公開されました。


クロスアテンションによるStableDiffusionの解釈

Cross Attentionを使用してプロンプトからピクセルレベルの属性マップを生成し、プロンプトが出力画像にどのように影響するかを示すことができる。


Rivers Have WingsさんのSDアップスケーラーのDemoが公開

使ってみました、細部がいい感じ
Before
After

前日のnoteに記録していたRiversHaveWingsさんのSDアップスケーラーのDemoが公開されています。さくっと試してみたい人はここから。


CycleDiffusion


NovelAI呪文生成器「Tags.novelai.dev」


表現


完全にAIで生成された顔と、顔アニメーション

Thin-Plate-Spline-Motion-Model を使用して、生成画像をアニメーション化
video2X を使用して拡大する
フレームを抽出し、GFPGAN を使用して顔を修正します
フレームを保存し、必要に応じて、投稿で行ったようにそれらをビデオに再結合します


"Postmodern Labor"

https://www.reddit.com/r/StableDiffusion/comments/yrtvmr/postmodern_labor/


研究


スタンフォード大学の研究者らが、大規模なモデル編集を高速に行う人工知能(AI)アプローチ「MEND」を開発


[実装付き]Stable Diffusionの追加学習に適する画像をVAEで選別する


思想・ムーブメント


累積最適化パワーによるAIタイムライン。より長く、より短く

このモデルを将来に外挿すると、AI タイムラインが短くなります: 2032 年までに AGI が発生する可能性は ~75% です。


AGI コンテンツ / タイムラインが短い理由 ~ AGI まで10年以内


ジェネレーティブAI が現在の 10 年間でどのようにすべてを破壊するか


ジェネレーティブ AIモデルがゲームの未来をどのように変えるか


ジェネレーティブ AI  — 脳の右側が再発明される?


2022年はいかにしてジェネレーティブAIの年になったか


シンギュラリティ:人類最後の発明?


勉強


Machine Learning Algorithms Cheat Sheet


拡散モデルの高速化に関するサーベイ動画


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます