日刊 画像生成AI (2022年10月23日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
過去の投稿はこちら
開発
Phenakiがオープンソース化
テキストから2分の動画が生成できる、数週間前大きな話題となったPhenakiの実装が公開されました。試したい。Phenakiは一連のテキストか、長文のストーリーを入力すれば最大数分の長さで動画を生成してくれるAI。
Phenakiはこれです。
NovelAIが1000Anlas配布
数週間前にあったNovelAIに影響を与える最近のサービスの不安定性からこの配布をすることにしたとのこと。
WebUI by AUTOMATIC1111が日本語に対応
StableDiffusionの実装で最も有名なWebUI by AUTOMATIC1111がついに日本語環境が導入されたようです。ちょっと使いやすくなりましたね
塗り絵モデル公開
WikiHowモデル公開
Wikihowで使われている画像を学習して特化させたモデルが公開。
https://huggingface.co/jvkape/WikiHowSDModel
こちらからダウンロードできます。
The new StableWarp v0.5.19 nightly build
背景をマスクして削除してくれる機能が搭載されたAIアニメーションが作れるcolabが公開されました。 https://www.patreon.com/posts/73646531 ここで10ドルでpatronになればダウンロードできるとのこと。
表現
この日素敵だった表現を2点セレクト。
美しい水彩表現 (StableDiffusion)
すごく綺麗…。プロンプトは公開されていません。
"The Beetles"
研究
Minecraftでブロック配置→コマンドラインでSD実行するワークフロー
Minecraft ウィンドウをキャプチャし、フォルダーに512x512にサイズ変更/トリミングするスクリプトを作り。InvokeAI(SDの実装の中でも有名な1つ)でフォルダー内の最新の画像を対象とするループで実行し、Stable Diffusion 画像に変換しているとのこと。最後にtkinter(pythonでguiを作るやつ)を介してStableDiffusionの画像保存フォルダーの最新の画像を表示しているそうです。
思想・ムーブメント
「バッハの蛇口」
ノースウェスタン大学の教授 Kate ComptonさんがAIの現状について「バッハの蛇口」という言葉を考えられています。
A Coming-Out party for Generative A.I, Silicon Valley's new Craze
なんだかんだでAI画像を鑑定する方法はあるらしい『AI見抜きクイズ攻略情報』
何故AIにはイラストを発注できないのか?
AI絵師、『爆乳機関車』という概念を爆誕させる
4chの動向
Twitterも、4chでも同様、基本的な絵の生成には飽きて、次のフェーズに移行しているようです。独自キャラや作風の模索に移行している。生まれてから飽きるまでのフェーズがめちゃくちゃ速くなってる感覚がある。NovelAIの基本的な画風っぽい絵を描いていた絵師さんたちに結構なダメージがいってしまいそう。
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。
画像生成AIの実験, 最新情報のまとめはこちら
過去の号はこちら
次の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます