見出し画像

日刊 画像生成AI (2022年10月23日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"マルチバース"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


過去の投稿はこちら


開発


Phenakiがオープンソース化

テキストから2分の動画が生成できる、数週間前大きな話題となったPhenakiの実装が公開されました。試したい。Phenakiは一連のテキストか、長文のストーリーを入力すれば最大数分の長さで動画を生成してくれるAI。

Phenakiはこれです。


NovelAIが1000Anlas配布

数週間前にあったNovelAIに影響を与える最近のサービスの不安定性からこの配布をすることにしたとのこと。

NovelAI コミュニティ!
10 月 13 日以降にサブスクライブしたすべてのアカウント、または 10 月 13 日から 10 月 18 日の間に画像を生成したすべてのアカウントに 1000 Anlas を入金しました。


WebUI by AUTOMATIC1111が日本語に対応

StableDiffusionの実装で最も有名なWebUI by AUTOMATIC1111がついに日本語環境が導入されたようです。ちょっと使いやすくなりましたね


塗り絵モデル公開


WikiHowモデル公開

Wikihowで使われている画像を学習して特化させたモデルが公開。
https://huggingface.co/jvkape/WikiHowSDModel
こちらからダウンロードできます。

https://www.reddit.com/r/StableDiffusion/comments/ybavif/wikihow_db_model_entirely_free_model_trained_with/


The new StableWarp v0.5.19 nightly build

背景をマスクして削除してくれる機能が搭載されたAIアニメーションが作れるcolabが公開されました。 https://www.patreon.com/posts/73646531 ここで10ドルでpatronになればダウンロードできるとのこと。


表現


この日素敵だった表現を2点セレクト。

美しい水彩表現 (StableDiffusion)

すごく綺麗…。プロンプトは公開されていません。

https://www.reddit.com/r/StableDiffusion/comments/yax33z/accurate_watercolor_technique_yes_sd_can_do_it/


"The Beetles"

https://www.reddit.com/r/midjourney/comments/ybc8ch/the_beetles/


研究


Minecraftでブロック配置→コマンドラインでSD実行するワークフロー

Minecraft ウィンドウをキャプチャし、フォルダーに512x512にサイズ変更/トリミングするスクリプトを作り。InvokeAI(SDの実装の中でも有名な1つ)でフォルダー内の最新の画像を対象とするループで実行し、Stable Diffusion 画像に変換しているとのこと。最後にtkinter(pythonでguiを作るやつ)を介してStableDiffusionの画像保存フォルダーの最新の画像を表示しているそうです。


思想・ムーブメント


「バッハの蛇口」

ノースウェスタン大学の教授 Kate ComptonさんがAIの現状について「バッハの蛇口」という言葉を考えられています。

新しい用語を宣言する:
バッハの蛇口とは、生成システムが、ある文化的に価値のあるオリジナルの品質以上のコンテンツを無限に供給するものの、無限に供給されることによって、それが希少ではなくなり、したがって価値が低くなってしまう状況のことである。

用途:「ああ、物語生成は解決したが、作者に感情移入しない限り誰も5千ものファンフィクションを読みたがらないことが判明し、大失敗したんだ。 完全にバッハの蛇口でしたね。」

私たちは、バッハの蛇口で何を「すれ」ばいいのか、実は知らないのです。 文化的な慣習のほとんどのパターンが通用しないのです。しかし、私たちはいくつかのパターンを見てきました。
スポーツとしてのキュレーションが重要になる

十分な速度があれば、それは会話になり得る。
「私たちの会話に使われる」「AIとの会話として」


A Coming-Out party for Generative A.I, Silicon Valley's new Craze

「シリコンバレーでは、暗号やメタバースは廃れている。ジェネレーティブA.I.が登場する」

"In Silicon Valley, crypto and the metaverse are out. Generative A.I. is in."

このコンピューターは5,000枚以上の高性能グラフィックカードを搭載し、すでに世界最大級のスーパーコンピューターとなっているが、来年中には現在の5倍から10倍の規模に成長させると発表し、喝采を浴びた。また、世界中のユーザーが独自のアルゴリズムでローカライズしたものを簡単に操作できるようになります。

mostaque氏に、安全が確認される前にジェネレーティブA.I.を世に放つことを心配しないかと尋ねたところ、彼はそうではないと答えました。A.I.の進歩は非常に速いので、最も安全なのは、それを一般に公開し、大企業ではなくコミュニティがその統治方法を決定できるようにすることだと、彼は言いました。

最終的には、トップダウンの管理ではなく、透明性を確保することが、ジェネレーティブなAIを危険な力にしないためのポイントだという。


なんだかんだでAI画像を鑑定する方法はあるらしい『AI見抜きクイズ攻略情報』


何故AIにはイラストを発注できないのか?


AI絵師、『爆乳機関車』という概念を爆誕させる


4chの動向

Twitterも、4chでも同様、基本的な絵の生成には飽きて、次のフェーズに移行しているようです。独自キャラや作風の模索に移行している。生まれてから飽きるまでのフェーズがめちゃくちゃ速くなってる感覚がある。NovelAIの基本的な画風っぽい絵を描いていた絵師さんたちに結構なダメージがいってしまいそう。


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

画像生成AIの実験, 最新情報のまとめはこちら


過去の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます