日刊 画像生成AI (2022年9月28日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
昨日までの投稿はこちら
開発
Video Killed The Radio Star Difusion
YouTubeリンクを貼れば、Whisperで文字起こし + 歌詞に合わせた画像生成→それが滑らかに変わっていくというもの。ミュージックビデオ生成を自動化します。Deforum Diffusionでも全然できますが、YouTubeと接続してるのはすごい。
ちなみに、「Video Killed The Radio Star」は1979年の曲で、ラジオスターの仕事がビデオによって無くなったという新しい時代の幕開けを感じる歌です。
こちらのビデオに影響されて作られたようです。
dreamboothトレーニングがDiffusersで利用可能に。
Textual Inversionの際と同様、学習済みのものが沢山まとまっているDreamBooth Concepts Libraryも誕生しています。
こちらのcolabで利用できるようです。
DreamBoothがついに12.5GBのVRAMでも動作可能に。(無料のcolab枠で利用可能。(9/28時点))
colabはこちら。
Redditはこちら。
ponze.gg
3D アセットのタイル可能なテクスチャを生成する AI を利用したプロトタイピング ツールが公開。 https://www.ponzu.gg/
Stable DiffusionがKeras CVで利用可能に
Loopback Zoom
生成中にパラメーターを変更したり、プロンプトを切り替えたりできるループバックスクリプトが公開されました。
動物キャラクターの特化モデルが公開。
furry、ケモノに特化したモデルが公開。
エポックはこちらからダウンロードできます。
HOLOSHEET v2
googleスプレッドシートに、ReplicateとOpenAIのAPIキーを入れると使えるそうです。こんな使い方もあるんですね。
(あまり詳しくは理解できておらずです。)
phase.artが進化
以前紹介していたphase.artがPhotoshopでStableDiffusionを利用しているような動作が可能なGUIになったようです。Inpainting、img2img、プロンプト履歴、プロンプト ビルダーまで搭載したとのこと。
1度に二人を学習させるには?
表現
Blender→Stable Diffusion img2img
アイデア賞、 MRIをレタスでimg2img。
SD Upscale + 4x UltraSharp + Topaz GigaPixelで脅威的なディテールで生成。
拡大して見たい方はこちらのリンクからどうぞ。
木星のミルクシェイク
研究
DreamBooth検証者続々
素晴らしいAIアートを作るための照明スキーム
顔をアニメーション化する方法についてチュートリアル
思想・ムーブメント
Stability.ai CTOのブログ
私たちは新しい芸術媒体の誕生を目の当たりにしています
AIのヒューマンファクター, 安全で倫理的なAI技術の開発
AIアートコンテスト 優勝者には$300(現在4万3000円程度)
AIの作ったアートに初めて著作権登録が認められる。
AIの第一人者ルカン氏、現在のアプローチの多くは真の知能につながらないと批判
ゲームのアセットとしてStable Diffusionを活用
画像生成AI「Stable Diffusion(AUTOMATIC1111版)」で一度に1000枚以上作ったりデフォルトのファイル名を変更したり生成が終わったらプッシュ通知したり知っておくといろいろ便利な設定方法まとめ
Gigazineさんが分かりやすくまとめてくれています。
深津さんの仮説
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。よかったらフォローしてくれるとうれしいです。
画像生成AIの実験, 最新情報のまとめはこちら
前回の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます