日刊 画像生成AI (2022年9月10日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
昨日までの投稿はこちら
(最近ゆっくりビュー数が増えてきて嬉しい。お役に立てて嬉しいです。)
開発
Apple Sillicon用 Stable Diffusion GUI登場
ソースコードと具体的な手順はこちら。
Stable Diffusion Unity向けプロジェクトデータ公開
replicateにタイル出力可能なStable Diffusion公開
必ずタイル出力になるように書き換えるようにするためのstable diffusion用コードは1週間前に公開され話題になっていました。3日前にreplicateで誰でも試しに触れるようになっていたみたいです。これは嬉しい。
試しに猫を出力してみた。
Trinart Colabnotebook
一昨日公開されたTrinartのColabnotebookが登場しました。
Stable Diffusion Drawing Web Editor登場
気軽にWebでドローイングして、img2imgするならこれを使うのがいいですね。クリスタとかPhotoshop使える人はいらないと思います。あと、procreateとかillustratorのプラグインも出てくるはずなので、そこまで需要はない気がしています。
Replicateと接続されています。UIも機能がこれから続々強化されればいいな..というところですね。
研究
モザイク化してそれぞれimg2imgで高解像度 & 高密度画像を生成。
img2imghdのさらに高度版ですね、このスピード感だと、まだ個人的な実験段階ですがすぐDeforumやWebUIや他の元にも追加されていくと思います。
img2imgで手や顔を修正するためのワークフロー
CFGスケールをあげると彩度やコントラスト比が上がりすぎることについて
プロンプトに大きな違いをもたらし、頻繁に使用したい単語とは..?
例えば、以下のものはかなり面白くなるらしい。もっと詳しくみたい方はRedditへ。
表現
質の良いWarp Diffusion一覧
ソニックのタイル
タイリングの可能性が広がることが感じられるのでメモ。
思想・ムーブメント
Greg Rutkowskiさん「もうすぐインターネットで自分の作品を見つけることができなくなると思う。」
promptとしてよく利用される「Greg Rutokowski」さん本人がTwitterでコメントされていました。Redditでも議論が生まれています。
画像生成AIで生成することの功績は認められるだろうか。
AI使用者なのか、素材製作者なのか、AI制作した人なのか。エンジニアなのか。元素材を持った人なのか。の議論がRedditで生まれています。この辺りどう法整備されるか。
勉強
以下昨日発見したのでメモ。読む。
書籍「Diffusion Models入門」
BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門
この本npkaさんの書かれている本でびっくりしました..笑
Vision Transformer入門 Computer Vision Library
最後に
かなり一時期の盛り上がりからは落ち着いてきた印象がありますが..、どうなのでしょうか。そろそろ日刊から週刊に移動してもいいような予感。個人的にはこれからもどんどん来ると思っています。
Twitterに、毎日製作したものや、最新情報、検証を載せています。よかったらフォローしていただけますと幸いです。
次号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます