日刊画像生成AI (2022年10月23日)

2022年10月25日 00:25

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

そんな中、毎日時間なくて全然情報追えない..！って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。

過去の投稿はこちら

開発

Phenakiがオープンソース化

テキストから2分の動画が生成できる、数週間前大きな話題となったPhenakiの実装が公開されました。試したい。Phenakiは一連のテキストか、長文のストーリーを入力すれば最大数分の長さで動画を生成してくれるAI。

Implementation of Phenaki Video, which uses Mask GIT to produce text guided videos of up to 2 minutes in length, in Pytorch

github: https://t.co/fq8Yqld12w pic.twitter.com/TZN7HWAeON
— AK (@_akhaliq) October 22, 2022

Phenakiはこれです。

こっちもやばい。

テキストから動画を生成するAI「Phenaki」が公開。
こちらは一連のテキスト、ストーリーを入力すると最大数分の長さの動画生成が可能。

すご...AIによる映画, アニメ, CM制作も現実になりそう..https://t.co/1KL05CdaCQ pic.twitter.com/BGiQevUUVc
— やまかず (@Yamkaz) September 30, 2022

Phenakiの2分ビデオやば…文字原稿さえあれば映画できるやん。。https://t.co/1o0D5dy4sI pic.twitter.com/eV4lUvZPnS
— モジョン (@mojon1) September 30, 2022

NovelAIが1000Anlas配布

数週間前にあったNovelAIに影響を与える最近のサービスの不安定性からこの配布をすることにしたとのこと。

NovelAI コミュニティ!
10 月 13 日以降にサブスクライブしたすべてのアカウント、または 10 月 13 日から 10 月 18 日の間に画像を生成したすべてのアカウントに 1000 Anlas を入金しました。

Anlas Compensation Notice:
Greetings NovelAI Community!
We just deposited 1000 Anlas to all accounts that were subscribed after October 13th or that generated images between October 13th and October 18th.
— NovelAI (@novelaiofficial) October 23, 2022

WebUI by AUTOMATIC1111が日本語に対応

StableDiffusionの実装で最も有名なWebUI by AUTOMATIC1111がついに日本語環境が導入されたようです。ちょっと使いやすくなりましたね

#StableDiffusion #WaifuDiffusion AUTOMATIC1111さんのstable-diffusion-webuiですが、デフォルトで日本語環境が導入されたみたいです（要設定＆再起動） pic.twitter.com/PoUJbuH9sR
— ザバイオーネ (@z_zabaglione) October 23, 2022

塗り絵モデル公開

WikiHowモデル公開

Wikihowで使われている画像を学習して特化させたモデルが公開。
https://huggingface.co/jvkape/WikiHowSDModel
こちらからダウンロードできます。

https://www.reddit.com/r/StableDiffusion/comments/ybavif/wikihow_db_model_entirely_free_model_trained_with/

The new StableWarp v0.5.19 nightly build

背景をマスクして削除してくれる機能が搭載されたAIアニメーションが作れるcolabが公開されました。 https://www.patreon.com/posts/73646531 ここで10ドルでpatronになればダウンロードできるとのこと。

The new StableWarp v0.5.19 nightly build with automatic (and manual) background masking is live!#stablediffusion #warpfusion
also has some other tweaks, but who cares :D

Grab it here, but make sure you have some spare luch money for colab as wellhttps://t.co/Tu2qL1UlgA pic.twitter.com/gyUM8WEz8F
— Alexander S (@devdef) October 22, 2022

表現

この日素敵だった表現を2点セレクト。

美しい水彩表現 (StableDiffusion)

すごく綺麗…。プロンプトは公開されていません。

https://www.reddit.com/r/StableDiffusion/comments/yax33z/accurate_watercolor_technique_yes_sd_can_do_it/

"The Beetles"

研究

Minecraftでブロック配置→コマンドラインでSD実行するワークフロー

Minecraft ウィンドウをキャプチャし、フォルダーに512x512にサイズ変更/トリミングするスクリプトを作り。InvokeAI（SDの実装の中でも有名な1つ）でフォルダー内の最新の画像を対象とするループで実行し、Stable Diffusion 画像に変換しているとのこと。最後にtkinter（pythonでguiを作るやつ）を介してStableDiffusionの画像保存フォルダーの最新の画像を表示しているそうです。

思想・ムーブメント

「バッハの蛇口」

ノースウェスタン大学の教授 Kate ComptonさんがAIの現状について「バッハの蛇口」という言葉を考えられています。

新しい用語を宣言する:
バッハの蛇口とは、生成システムが、ある文化的に価値のあるオリジナルの品質以上のコンテンツを無限に供給するものの、無限に供給されることによって、それが希少ではなくなり、したがって価値が低くなってしまう状況のことである。

declaring a new term:
A Bach Faucet is a situation where a generative system makes an endless supply of some content at or above the quality of some culturally-valued original, but the endless supply of it makes it no longer rare, and thus less valuable
— Dr Kate Compton #BotGirlSummer (@GalaxyKate) October 22, 2022

用途：「ああ、物語生成は解決したが、作者に感情移入しない限り誰も5千ものファンフィクションを読みたがらないことが判明し、大失敗したんだ。完全にバッハの蛇口でしたね。」

Use: "Yeah, we solved narrative generation, but it turns out that no-one wants to read five thousand fanfic stories unless they have an emotional connection to the authorship, and it flopped. Was a total Bach Faucet."
— Dr Kate Compton #BotGirlSummer (@GalaxyKate) October 22, 2022

私たちは、バッハの蛇口で何を「すれ」ばいいのか、実は知らないのです。文化的な慣習のほとんどのパターンが通用しないのです。しかし、私たちはいくつかのパターンを見てきました。
スポーツとしてのキュレーションが重要になる

十分な速度があれば、それは会話になり得る。
「私たちの会話に使われる」「AIとの会話として」

We don't actually know what to *do* in a Bach Faucet. Most patterns of cultural practice don't hold up. But we *have* seen a few:

Curation-as-a-sport becomes important
If fast enough, it can become conversational:
- used in *our* conversations
- as conversation *with* AI
— Dr Kate Compton #BotGirlSummer (@GalaxyKate) October 22, 2022

A Coming-Out party for Generative A.I, Silicon Valley's new Craze

「シリコンバレーでは、暗号やメタバースは廃れている。ジェネレーティブA.I.が登場する」

"In Silicon Valley, crypto and the metaverse are out. Generative A.I. is in."

このコンピューターは5,000枚以上の高性能グラフィックカードを搭載し、すでに世界最大級のスーパーコンピューターとなっているが、来年中には現在の5倍から10倍の規模に成長させると発表し、喝采を浴びた。また、世界中のユーザーが独自のアルゴリズムでローカライズしたものを簡単に操作できるようになります。

mostaque氏に、安全が確認される前にジェネレーティブA.I.を世に放つことを心配しないかと尋ねたところ、彼はそうではないと答えました。A.I.の進歩は非常に速いので、最も安全なのは、それを一般に公開し、大企業ではなくコミュニティがその統治方法を決定できるようにすることだと、彼は言いました。

最終的には、トップダウンの管理ではなく、透明性を確保することが、ジェネレーティブなAIを危険な力にしないためのポイントだという。

なんだかんだでＡＩ画像を鑑定する方法はあるらしい『ＡＩ見抜きクイズ攻略情報』

何故AIにはイラストを発注できないのか？

はてなブログに投稿しました #はてなブログ

人間とAIのイラストが見分けられなかったとして、それはAIにイラストを発注できることにはならないという話を書きました

22/10/23 何故AIにはイラストを発注できないのか？ - LWのサイゼリヤhttps://t.co/ZKnlom16sR
— LW (@lw_ru) October 23, 2022

AI絵師、『爆乳機関車』という概念を爆誕させる

【悲報】AI絵師、『爆乳機関車』という概念を爆誕させる🥶 https://t.co/6M6LWZBXV4
トーマスじゃん pic.twitter.com/pC2B5sighP
— なる (@nalltama) October 22, 2022

4chの動向

Twitterも、4chでも同様、基本的な絵の生成には飽きて、次のフェーズに移行しているようです。独自キャラや作風の模索に移行している。生まれてから飽きるまでのフェーズがめちゃくちゃ速くなってる感覚がある。NovelAIの基本的な画風っぽい絵を描いていた絵師さんたちに結構なダメージがいってしまいそう。

4chを調べていて、AI絵が日進月歩という現実を目の当たりにしてる。
特定絵師の模倣が進行するかと思ったら、自分独自のキャラや作風の模索に段階が移っていた。
以前の単純なコピペ絵、コピペ塗りは相当減った。
— 高村武義 #WalkAway (@tk_takamura) October 22, 2022

左は朝凪先生の学習データを使った絵。
右は”異世界のビキニ春麗”というお題で作ったもの。
塗りに関してはもう人とAIの区別がつかない。 pic.twitter.com/ilzAQmxHUE
— 高村武義 #WalkAway (@tk_takamura) October 22, 2022

この様に手の問題もかなりクリアしてきた。 pic.twitter.com/a1VyQznlWw
— 高村武義 #WalkAway (@tk_takamura) October 22, 2022

最後に

Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

Tweets by Yamkaz

画像生成AIの実験, 最新情報のまとめはこちら

過去の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます

日刊 画像生成AI (2022年10月23日)

開発