見出し画像

日刊 画像生成AI (2022年9月14日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"AIが引き起こす巨大なムーブメント"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


以前作品紹介させていただいてたSaito Akiraさんもコメントくれました。
喜んでもらえてよかったです。


昨日までの投稿はこちら


ツール開発


Img2imgアルゴリズムの進化

昨日の日刊で紹介していたものがWebUI(by AUTOMATIC1111)に実装されているようです。普通のimg2imgだと少しプロンプトを変えただけで大きく結果が変わり、微調整が難しいですがこの技術を使えば、ほぼ形を変えず口を少し笑顔にしたり、髪色を変えたりということが可能です。

ただRedditのリプライを見る限り、機能は一部の画像では有効だが、有効じゃないものもあるとのことです。


DreamLike.art UIが更新。

Stable DiffusionがWebで使えるサービス、DreamLikeのUIが更新されました。UIが美しい上、あらゆる機能が入っていて素晴らしすぎます。これにWebUIに入ってる様々な機能も入れば..やばいですね。現在無料ですが近日中に有料プランが追加されるとのことです。

使ってみたのですが生成した画像の履歴をinit imageにしたり、バリエーション生成したりとmidjourneyレベルの素晴らしいUI。全てのデータをいちいちメモする必要がありません。


シンプルすぎるStable Diffusion API登場。

URLにpromptを入力するだけで画像が出てきます。
例えば以下のようなcodeを書くだけで画像を取得できるそうです。

const target = "pizza";
["purple", "green",
"blue",   "black"]
.forEach( (color) => {
const img = new Image();
img.src =
"https://api.computerender.com/" +
`generate/${color}-${target}.png`;
container.appendChild(img);
});


500のアーティストスタイルが見れるWebサイト

アーティストリストはgoogle spread sheetや、notionのデータベースで公開されていることが多いですが、こちらはサイトで簡単にアクセスできます。特定のアーティスト同士を組み合わせることでいい結果が得られるとのことです。


PromptのためのGPT3がKrea.aiにもうすぐ登場?

機能としては、Chrome拡張機能のDALLE Prompt Helperと変わらなそうですが、今後の展開が楽しみです。


研究


img2img ハイクオリティスタイル変換

img2imgで映画のシーンをローポリ風に変換されている方の投稿が伸びています。かなり質が高いです。今後あらゆる過去作品がスタイルを変えて復活する…みたいな未来もあるのかもしれません。それかこの技術を使った新しい見え方の映画とか。

https://www.reddit.com/r/StableDiffusion/comments/xdfiri/improved_img2img_video_results_link_and_zelda_go/

井口さんが仕組みを日本語で分かりやすく記載されていたので載せておきます。


StoryDALL-E

現時点で公開されている画像生成AIはプロンプトごとに生成結果がかなり変わるので物語を作ることが難しいです。(なんとなく作ることは可能です)この研究はその継続する画像のためのものです。画像を見る限りかなり同じキャラクターが生成できるのでもう漫画や絵本が作れそう。


モーショングラフィック → StableDiffusionでスタイル変換


Steps と Guidance Scale 値の比較表

https://www.reddit.com/r/StableDiffusion/comments/xdvgyn/i_made_a_comparison_table_between_steps_and/


StableDiffusion 1.5v アーティストスタディ公開

現在201のアーティスト(prompt)が登録されているとのこと。


SamplerとStepsの比較

https://www.reddit.com/r/StableDiffusion/comments/xe26ob/sampler_v_steps/


表現


StableDiffusion Animation よかったものセレクト


技術


TensorRTを使用してStable Diffusionを 25% 高速化


IDE-3D


Composable-Diffusion


思想・ムーブメント


グーグルのDeepMind研究者が共同執筆した論文で、AIは人類を絶滅させると述べている


オンライン アート コミュニティが AI 生成画像の禁止を開始

「イラスト投稿サイトでAIアートが無制限に投稿されまくる状態になれば、人間が描いたイラストを見つけることすら困難になってしまう可能性がある」というコメントには確かに共感しました。AIアートと人間の描いたアートには棲み分けが必要なのかもしれません。禁止まではせず、ハッシュタグで管理するというのでもいい気がしていますが..。どうなるんでしょうか。

gigazineさんが分かりやすく日本語化してくれていましたので是非。


mimic、今後の展開について発表


RJ Palmer vs Emad

かなり前に画像生成AIについて問題視されて話題になったコンセプトアーティストのRJ PalmerさんがEmadさんのコメントについて言及。Emadさんもそれに対し、言及されています。

RJ Palmer:
私が取材を受けたAI画像生成機に関するBBCの記事がアップされています。Stable Diffusionの創始者は、ここでは本当にバカ野郎のように見えます。この人は純粋にアーティストを理解していないんだ。

Emad:
しかし、Mostaque氏はアーティストが職を失うことを心配していないというこのプロジェクトはMicrosoftの表計算ソフト Excelのようなツールであり、それは会計士を失業させなかった。「私は今でも会計士に給料を払っている」と彼は述べている。

ではイラストレーションやデザインなどの将来のキャリアに悩む若いアーティストへの彼のメッセージはなんですか?彼らへの私のメッセージは、「イラストデザインの仕事はとても退屈だ」ということです。それは芸術的であることではなく、あなたのツールです。

彼は彼らが新しいテクノロジーを使って機会を見つけることを提案しています。

Emad:
という質問を受けたので、読み物としても面白いので明記しておきます。
これらのAIモデルは、以下のことが可能なツールです。
1.ありふれた画像出力を簡単にする
2.アーティストに新しい発想の方法を提供する
3.より多くの人がアーティストになることを可能にする
4.新しい創造的な仕事を大量に生み出す
5.ツール=低賃金労働者


勉強


Stable Diffusionはどのように機能するのか?

とても分かりやすくTwitterでStable Diffusionの中身について解説されている方がいたのでメモ。こちらもgigazineさんが分かりやすく解説されてました。


拡散モデルサーベイ


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せています。よかったらフォローしていただけますと幸いです。

https://twitter.com/Yamkaz


前回の号はこちら

次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます