見出し画像

日刊 画像生成AI (2022年9月1日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

Stable Diffusion v1.5で生成したもの

そんな中、毎日時間なくて全然情報追えない..!って人のために個人的に日々まとめている業界変化、新表現、思考、問題、技術を投稿していこうと思います。あまりの変化の速さに個人的に毎日まとめていたものを友達に公開したところ反応がよかったため、このような経緯となりました。

今日から毎日投稿です。


次の号はこちら
(見てくれる人どんどん増えてて嬉しい。)


技術


DALL・E 「Outpainting」追加

これまで他の画像生成と比べ、キャンバスが小さい問題があったDALL・E。今回のアップデートで大きく変わります。以下Openaiが出してた公式事例です。すごい、期待しかない。

https://twitter.com/OpenAI/status/1565009342092324864
https://twitter.com/OpenAI/status/1565009366951989248/photo/1
https://twitter.com/OpenAI/status/1565009354708992003/photo/1

個人的に使ってみました。
クリムトさんの新しい絵を生み出し、それをoutpaintingでどこまで行けるか試してみます。

"New Klimt painting"
Outpainting(6回)
Outpainting(9回)
Outpainting(12回)
Outpainting(どのくらいやっただろ..かなり..)

📝 豆知識
https://patch-e.com/
PATCH・Eというサービスがあり、同様のことができました。
ただ、いちいちDALL・Eの生成画像ダウンロードして、トリミングして、アップロードしてを繰り返して..と面倒な作業をせねばならずでしたが、これも不要になりましたね。嬉しい。


Stable Diffusion v1.5 テスト実施

昨日10:00から始まりました。Stable Diffusionチェックポイント1.5を、Discord botを使い、テスト中。プロポーションがかなり優れており、奇妙に歪んだ顔を生成しなくなったそうです。
(Midjourneyの--upbeta, --beta, --creativeのテストと似てる。)

Stable Diffusion Discordはこちらから。

https://www.reddit.com/r/StableDiffusion/comments/x2a4hi/the_new_15_model_update_is_crazy_good_with/


ERNIE-ViLG公開

※ 8/29に公開されていたっぽい。
中国製の画像生成AIが話題に上がっています。


表現


KAREN X CHENG チュートリアル公開

映像監督 KAREN X CHENGさんが先日バズったAIを用いた映像のチュートリアルを公開。


img2img:顔をイケメンに加工

※ 8/31の情報です。
img2imgを使って、プロフィール写真をかっこよく変える実験をしている方がいらっしゃいました。


踊る珊瑚礁?


蝋人形の美しい表現


開発


Deforum Stable Diffusion v0.2公開

※ 8/31の情報です。
色々Google Colabでツールが出ていますが、正直。


Stable Diffusion for Kirita 開発

※ 8/31の情報です。

KiritaはmacOS、Linux、windows対応。
kiritaはここからダウンロードできます。


AIピカソリリース

※ 8/31の情報です。
スマホアプリとしてStableDiffusionを実装した方が現れました。


KREA.ai登場

Lexica.artが、現状Stable Diffusionの過去の制作物を見るのに最適でしたがこれはsaveボタンがありかなり良い印象。modifierで検索できるのでかなり優秀。しばらくこれを利用しそう。

全体観はこんな感じ。
modifier検索


研究


美学評価モデルを利用し、ランダムなプロンプトを美的に進化させる進化的アルゴリズムを構築。(Stable Diffusion)


Sampler と Stepsの研究事例

https://twitter.com/iScienceLuvr/status/1564847717066559488


img2img&フォトバッシュ複合ワークフロー

画像生成AIのゴールは言われた通りに描き、またここ治してと話せば直してくれるいわゆる対話型を目指しているというお話を見たことがありますが、現状AIはまだまだクオリティが低い状態です。その状態の中でより思い通りのものを作られています。

以下noteより


ムーブメント


生成画像でアートコンペ優勝

Midjourneyで画像生成し、そのまま誰にも気づかれず優勝してしまった事例が注目が集まってます。

https://www.reddit.com/r/awfuleverything/comments/x25xzl/someone_won_an_art_competition_using_an_ai/


画像自動生成AIと著作権について

一昨日〜今日くらいまでかなりホットな話題である「mimic」。こちらに沿ってネット上では様々な議論が飛び交いました。その流れか柿沼さんがわかりやすく、情報たっぷりのブログを書いてくださっています。是非。


思想


2023年のクリエイティブの求人市場

AIコンテンツ作成ツールで、一時期バズってたRunwayのCEOの方のツイート。シニアプロンプトアーティスト、モデル トレーニング アート ディレクターってなるかは分からないですが、何かしらの形で専門家が生まれると思います。


画像生成AIの創造性

これは確かにそうですね、カメラと同じと考えると諸々の細かい設定をできる、それに詳しいということは価値がありそうだし、そこに創造性がある。


最後に

いやとにかく最近..画像生成AIの注目度やばいですね。
Midjourneyでイラスト大量バズに続き、Stable Diffusionのトレンド入りから、mimmicが話題に上がったり..、ひたすら毎日ニュースがありすぎて楽しい日々です。

前書いていたnoteもお陰様で反応やコメントを頂けて嬉しかったです。


Twitter、毎日製作したアートや、最新情報、検証を載せているのでよかったらフォローしてね
https://twitter.com/Yamkaz





次の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます