日刊 画像生成AI (2022年9月14日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
以前作品紹介させていただいてたSaito Akiraさんもコメントくれました。
喜んでもらえてよかったです。
昨日までの投稿はこちら
ツール開発
Img2imgアルゴリズムの進化
昨日の日刊で紹介していたものがWebUI(by AUTOMATIC1111)に実装されているようです。普通のimg2imgだと少しプロンプトを変えただけで大きく結果が変わり、微調整が難しいですがこの技術を使えば、ほぼ形を変えず口を少し笑顔にしたり、髪色を変えたりということが可能です。
ただRedditのリプライを見る限り、機能は一部の画像では有効だが、有効じゃないものもあるとのことです。
DreamLike.art UIが更新。
Stable DiffusionがWebで使えるサービス、DreamLikeのUIが更新されました。UIが美しい上、あらゆる機能が入っていて素晴らしすぎます。これにWebUIに入ってる様々な機能も入れば..やばいですね。現在無料ですが近日中に有料プランが追加されるとのことです。
使ってみたのですが生成した画像の履歴をinit imageにしたり、バリエーション生成したりとmidjourneyレベルの素晴らしいUI。全てのデータをいちいちメモする必要がありません。
シンプルすぎるStable Diffusion API登場。
URLにpromptを入力するだけで画像が出てきます。
例えば以下のようなcodeを書くだけで画像を取得できるそうです。
const target = "pizza";
["purple", "green",
"blue", "black"]
.forEach( (color) => {
const img = new Image();
img.src =
"https://api.computerender.com/" +
`generate/${color}-${target}.png`;
container.appendChild(img);
});
500のアーティストスタイルが見れるWebサイト
アーティストリストはgoogle spread sheetや、notionのデータベースで公開されていることが多いですが、こちらはサイトで簡単にアクセスできます。特定のアーティスト同士を組み合わせることでいい結果が得られるとのことです。
PromptのためのGPT3がKrea.aiにもうすぐ登場?
機能としては、Chrome拡張機能のDALLE Prompt Helperと変わらなそうですが、今後の展開が楽しみです。
研究
img2img ハイクオリティスタイル変換
img2imgで映画のシーンをローポリ風に変換されている方の投稿が伸びています。かなり質が高いです。今後あらゆる過去作品がスタイルを変えて復活する…みたいな未来もあるのかもしれません。それかこの技術を使った新しい見え方の映画とか。
井口さんが仕組みを日本語で分かりやすく記載されていたので載せておきます。
StoryDALL-E
現時点で公開されている画像生成AIはプロンプトごとに生成結果がかなり変わるので物語を作ることが難しいです。(なんとなく作ることは可能です)この研究はその継続する画像のためのものです。画像を見る限りかなり同じキャラクターが生成できるのでもう漫画や絵本が作れそう。
モーショングラフィック → StableDiffusionでスタイル変換
Steps と Guidance Scale 値の比較表
StableDiffusion 1.5v アーティストスタディ公開
現在201のアーティスト(prompt)が登録されているとのこと。
SamplerとStepsの比較
表現
StableDiffusion Animation よかったものセレクト
技術
TensorRTを使用してStable Diffusionを 25% 高速化
IDE-3D
Composable-Diffusion
思想・ムーブメント
グーグルのDeepMind研究者が共同執筆した論文で、AIは人類を絶滅させると述べている
オンライン アート コミュニティが AI 生成画像の禁止を開始
「イラスト投稿サイトでAIアートが無制限に投稿されまくる状態になれば、人間が描いたイラストを見つけることすら困難になってしまう可能性がある」というコメントには確かに共感しました。AIアートと人間の描いたアートには棲み分けが必要なのかもしれません。禁止まではせず、ハッシュタグで管理するというのでもいい気がしていますが..。どうなるんでしょうか。
gigazineさんが分かりやすく日本語化してくれていましたので是非。
mimic、今後の展開について発表
RJ Palmer vs Emad
かなり前に画像生成AIについて問題視されて話題になったコンセプトアーティストのRJ PalmerさんがEmadさんのコメントについて言及。Emadさんもそれに対し、言及されています。
勉強
Stable Diffusionはどのように機能するのか?
とても分かりやすくTwitterでStable Diffusionの中身について解説されている方がいたのでメモ。こちらもgigazineさんが分かりやすく解説されてました。
拡散モデルサーベイ
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せています。よかったらフォローしていただけますと幸いです。
前回の号はこちら
次の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます