見出し画像

日刊 画像生成AI (2022年9月29日)

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

"魔法のテクノロジー"

そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。


しばらく遅くなっててごめんなさい。
(仕事とプライベートがちょっとバタバタしています、)
なんとか追いつく仕組みを考えたので待っててください!


昨日までの投稿はこちら


開発


DALL・E2がウェイトリストを解除。 誰でも利用できるように。

徐々にウェイトリスト登録してから開始できる期間が短くなっていましたがとうとうこの日解除されました。


NovelAIが徐々に開発経過を公開中。 やばい..

(投稿時間の本日10/3に公開され使用できるようになっています。)
クオリティが高すぎて話題を呼んでいます。


77個のトークン制限を回避して、好きな量のトークンを使用することができるSequential token weighting


表現


Emad DreamBooth (ckpt配布)

Stability.aiのCEO Emad MostaqueさんをDreamBoothで学習した方がいました。ダウンロードはこちら

https://www.reddit.com/r/StableDiffusion/comments/xqyv9j/emad/

海外のCMディレクターの方がDeforum Diffusionを仕事に活用。

40個のプロンプトでレンダリングは1回のみとのこと。
なかなかお目にかかれないクオリティなので要チェックです。


iPhoneの背景をインタラクティブな生成画像に


映像の周りをOutpainting

https://www.reddit.com/r/dalle2/comments/xr3o0z/playing_with_using_dalle2_and_video_for_an/


AIアニメーションセレクト

毎日投稿されているAIアニメーションから素晴らしい作品のみピックアップするコーナー。今日はこちら。


101人のAIアーティストのメガスレッド

リプ欄にAIアーティストの方が沢山掲載されています。


ペットのクマムシを散歩させる1800年代の男性

https://www.reddit.com/r/StableDiffusion/comments/xqfczs/a_man_in_the_1800s_walking_his_pet_tardigrade/


研究


DALL-E Prompt Design:フォトリアリズム-現実を模倣する

Dall-E 2のフォトリアリズムに関するヒントが掲載された素晴らしい記事です。


Stable Diffusion Dreambooth Concepts Library による DreamBoothの ファインチューニング

npakaさんによる「Stable Diffusion Dreambooth Concepts Library」で提供されているDreamboothの学習用、推論用colabノートブックの検証。


Textual InversionとDreamBoothの併用

Textual Inversionでブレードランナーのラスベガス(コンクリート構造物のシーン)を6〜7枚学習させ、DreamBoothでブレードランナーのジョイの画像16枚を学習させ、統合して使われているようです。

https://www.reddit.com/r/StableDiffusion/comments/xr8cs8/brutalist_joi_dreambooth_training_combined_with/


画像を綺麗にOutpaintingする簡単な方法

ラフなペイントを施してから、その画像サイズでimg2imgすれば綺麗になるよとのこと。

https://www.reddit.com/r/StableDiffusion/comments/xquv7i/an_easy_way_to_enlarge_an_image_i_hope_it_will_be/


CLIPのイラスト美的スコアが人間の感性と相関があるか検証


DreamBooth, DreamFields3D検証者続々

制作の仕方が分かりやすく公開されてきたので利用されているユーザーの方がどんどん増えています。


AUTOMATIC1111のattention増加の検証

StableDiffusionが使えるインターフェースとして最も人気があり、高機能なWebUI by AUTOMATCIC1111。この一機能としてattentionの操作ができるようです。機能が毎日どんどん増えるので、こういう検証があると非常に覚えやすいので助かる。

https://www.reddit.com/r/StableDiffusion/comments/xr579x/new_method_of_setting_attention_weighting_in_a1111/


「A as B」は有効

こちらの画像は「Ghandi as Yoda」から始まるプロンプトで生成されています。現時点でStable Diffusionでは「A as B」はなかなか有効なようです。

https://www.reddit.com/r/StableDiffusion/comments/xqiwzs/found_a_good_prompt_for_as_images/


思想・ムーブメント


「StableDiffusionを違法にすべきか、それとも真にオープンソース AI が存在するべきか?」


強力な汎用 AI が間もなく登場すると思う理由


画像が読み込まれるのを待つのは、奇妙にも初期のインターネット時代を思い起こさせます。


タトゥーとして活用


最後に


Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。よかったらフォローしてくれるとうれしいです。

画像生成AIの実験, 最新情報のまとめはこちら


前回の号はこちら


サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます