日刊画像生成AI (2022年11月21日)

2022年12月1日 23:26

ジェネレーティブAI界は、今とても早いスピードで進化し続けています。

そんな中、毎日時間なくて全然情報追えない..！って人のためにこのブログでは主に画像生成AIを中心として、業界変化、新表現、思考、問題、技術や、ジェネレーティブAI周りのニュースなど毎日あらゆるメディアを調べ、まとめています。

過去の投稿はこちら

📣お知らせ
ジェネレーティブAIで取り組みたい事業があり現在進めています
Webアプリケーション開発ができ今後一緒に取り組める方を探しています。
言語, 環境: AWS, React native, Python, Flutter, …など
もし興味がありましたら、TwitterでDMをいただけますと幸いです🙇

開発

あるふさんがパブリックドメインしか使っていないイラスト向け超解像モデル「HAT-CC-0」を公開

あるふさんがパブリックドメイン画像しか学習に使っていない、イラスト向け超解像モデルが先出しで公開！

イラスト向け超解像モデルで学習画像はパブリックドメインしか使っていないHAT-CC-0を公開しました。イラストレーターで超解像の学習画像が気になる人向けです。本来はClean Diffusion などに使うものですが、先に公開しておきます。https://t.co/mae39ULnzv
— あるふ (@alfredplpl) November 21, 2022

NVIDIAから「Magic3D」を公開

たかにゃしりょうさんが説明を書かれていたのでメモです
NVIDIAからtext-to-3Dが発表です。

NVIDIAがテキストから3D生成する手法「Magic3D」を発表。グーグルが約2ヶ月前に発表した「DreamFusion」よりも2倍高速。さらに、DreamFusionよりも61.7%の評価者に好まれたとのこと。さらに、既存の画像編集技術を利用して、3Dオブジェクト編集に拡張https://t.co/hhTc4PIcZw pic.twitter.com/foANtM4HkQ
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) November 21, 2022

Synthwave/Outrun スタイルを使えるモデルが公開

カッティングシートモデルが公開

https://www.reddit.com/r/StableDiffusion/comments/z0xyk2/dreambooth_model_for_cutting_machines/

Clone Warsモデルが公開

https://www.reddit.com/r/StableDiffusion/comments/z18vg4/i_made_a_clone_wars_model_hugging_face_in_comments/

Ghibli Diffusionが公開

https://www.reddit.com/r/StableDiffusion/comments/z17mdv/new_release_dreambooth_model_finetuned_on_classic/

活用した事例があったのでメモです、インペインティングを利用しているからこういうのが描けているそうですが、ぱっと見分からなくてすごい。
Nijijourneyに関しては割と」一発でこういうの出せたりするのでよりすごい

え..やばくない？
Stable Diffusionのジブリモデルで生成された画像
信じられない..https://t.co/kt6aXpo82R pic.twitter.com/mHX9N6v9Tu
— やまかず (@Yamkaz) November 22, 2022

Emoji Diffusionが公開

https://www.reddit.com/r/StableDiffusion/comments/z14v7u/emoji_diffusion_stable_diffusion_finetuned_to/

Render Diffusion

単眼2D監視のみを用いて学習可能な3D生成・推論用の初の拡散モデル「RenderDiffusion」が発表！単眼3D再構成、3D-aware inpainting、無条件生成に利用可能とのこと。3DのInpaintingとかワクワクすぎる

各拡散ステップでシーンの3D表現を生成しレンダリングすることで、従来の2D拡散モデルに3D構造を導入しています

RenderDiffusion: Image Diffusion for 3D Reconstruction, Inpainting and Generation
abs: https://t.co/FnqzvKa6sQ pic.twitter.com/WyfJV1LVvQ
— AK (@_akhaliq) November 21, 2022

SimulacraBot

SimulacraBotというのがあり、stablediffusionを使用して画像を生成し、他のユーザーが作成した画像を評価して、人間の美的嗜好のパブリックドメインデータセットを作成するプロジェクトらしいけど現在は閉じられています。

SimulacraBot is back! Generate images and rate images made by others using #stablediffusion to make a public domain dataset of human aesthetic preferences. Join on Discord using the invite below:https://t.co/CWHxvLLwNP
— John David Pressman (@jd_pressman) November 20, 2022

Riveraが公開

~~けんすうさんが関わったNovelAIを搭載しているかもしれない無料画像生成AIサービスRiveraが存在しているようです。~~
~~（うみゆきさんのいくつかのツイートのリツイートと投稿で確認。）~~
現在は使用しないものとなっています

こちらご紹介頂いておりますが、リリース当初はNovelAIを利用していましたが、一部利用規約外の部分があったため取り下げ、現在はNovelAIを使用しないものとなっております。

日刊画像生成AI (2022年11月21日)｜やまかず @Yamkaz #note https://t.co/OMI7ciCYR3
— Rivera（リベラ） (@ai_rivera_ai) December 2, 2022

WebUIエクステンション集、LexiKrea、Depthmap、training-picker

うみゆきさんがWebUIのエクステンションをいくつか投稿されていたのでとても参考になったので拝借、LexiKreaという生成画像検索サイトのLexica、Kreaからプロンプトを持ってこれるエクステンションがあるみたいです。

LexiKrea。これまたWebUIのエクステンションで、検索ワード入れるとLexicaとKreaからプロンプトを引っ張ってきてくれる。自分でプロンプトを練るのがダルい時に便利そう　https://t.co/jQmCBcHWXL
— うみゆき@AI研究 (@umiyuki_ai) November 21, 2022

こちらは、MiDaSで深度マップ生成できるようです。
こんなに今WebUIのエクステンション増えているんですね、いつの間に

これもWebUIにインスコできるエクステンションで、生成画像からMiDaS使ってサクッとデプス生成してくれるツール →RT https://t.co/Xfi4ZdoWT7
— うみゆき@AI研究 (@umiyuki_ai) November 21, 2022

動画から学習用画像を引き出してくれるエクステンション。

WebUIにインスコできるエクステンションで、動画から学習用画像を切り出すのを簡単にしてくれるツールらしい　https://t.co/DnaAGrFGqk
— うみゆき@AI研究 (@umiyuki_ai) November 21, 2022

画像1枚からできるNerfが発表

学習時に複数のビューを利用することなく、1枚の物体画像からSDFパラメータ化された3次元形状、姿勢、外観を復元するものとのこと。すごい

Ask4Help

現在AIエージェントは性能上がってきているけどプロダクトレベルじゃない、それらを埋めるために人間の支援を要求し、その利用することを可能にするAsk4Helpポリシーの提案。

（bioshokさんが説明してくださっていたのでメモ）

面白い研究。前からAIは入力に対して出力するだけで疑問に思ったら質問とかしないと思ってたけど、この研究でオブジェクトナビゲーションなどのタスクでエージェントが人間に適度に問い合わせ（問い合わせしすぎは負の報酬）、成功確率が高まる。自然言語処理AIに応用できたら良さそう（あるのかな）。 https://t.co/3HurAhkSoI
— bioshok(INFJ) (@bioshok3) November 21, 2022

表現

AIでゲーム制作してみた

Stable DiffusionやMidjourneyなどで作られた画像素材で作られたゲーム。5時間で制作されたようです

Game PROOF OF CONCEPT: Full @StableDiffusion @midjourney_ai RPG GAME DEMO! This whole demo took less than 5 hours to complete using godot/krita/sd/mj @ThisWeekInGodot @StabilityAI @StableDiffusion @Scobleizer @emmanuel_2m @pscarlyle @_akhaliq @amli_art #IndieGameDev @KaliYuga_ai pic.twitter.com/Ch8h8NmcCK
— Lucas Ferreira da Silva (@bioinfolucas) November 20, 2022

852話さんのAI漫画

AI画像で漫画を作ってみた　そのうち続く（1/n）#終末のオレンジ　 #漫画が読めるハッシュタグ pic.twitter.com/wz8fdWJqej
— 852話 (@8co28) November 20, 2022

Nijijourneyの凄さがどんどんあらわに

nijijourney生成テスト

吐息が聞こえそうな雰囲気でイチャイチャが描けるのは3人。#nijijourney #midjourney #AIart pic.twitter.com/utPKpQPnaY
— 𝒏🅞𝒈𝒖𝒊𝒔𝒔 (@n0guiss_y) November 20, 2022

（とほがえるさんの作品全て素敵なのでおすすめです！）

最高最高最高!!!!!!!!#nijijourney pic.twitter.com/zXbgNyH3Wi
— とほがえる (@tohofrog) November 21, 2022

#nijijourney pic.twitter.com/Gm3P9PXCoB
— Tansa (@_tansa_) November 20, 2022

#nijijourney #midjourney pic.twitter.com/UISyhR6wt4
— まっちゃ (@maccha3gooo) November 20, 2022

#nijijourney 、二次創作の解像度がエグすぎる
NAIでもワンピースはパチモンみたいなのしか出なかったけど、めちゃくちゃ完璧に出る
promptはそれぞれルフィとかゾロとか、直球にしか入れてない pic.twitter.com/5HN1VOsovx
— かりみや (@Callimiya) November 20, 2022

研究

Eagleが生成画像管理に適切..？

ただ、中に入っているプロンプトが表示できないという点があらしいので、そこを解決できるサービスあればいいかもしれない。

凄い勢いで絵を生成するStableDiffusion、絵の管理をどうするか悩んでいたんですが、最強のツールを発見。
これは便利だ…https://t.co/iySnELGKIa
— kaz (@tkaz2009) November 21, 2022

Stable Diffusion を使用してランダムなゲームアートアセットを作成する方法 (チュートリアル)

1500以上の形容詞、副詞、間投詞、名詞、前置詞、動詞がテストされました! コメント内のリンク

写真のようにリアルな高解像度のポートレートを作るワークフロー

思想・ムーブメント

Unstable Diffusion

ついにGigazineさんがUnstable Diffusion取り上げてました

画像生成AIで18禁エロ画像を作成することに情熱を燃やす集団「Unstable Diffusion」とは？https://t.co/qu4VoNphem
— GIGAZINE(ギガジン) (@gigazine) November 21, 2022

Futurist「【前編】10年後、世界はSFになる＜AIエージェント（一般化知能）の実現」

bioshokさんが登壇されています、とても重要なことをまとめられているのでぜひ。

11/26（土）20時〜、「【前編】10年後、世界はSFになる＜AIエージェント（一般化知能）の実現＞」をライブにて開催したいと思います！

汎用人工知能の前に訪れる「AIエージェント（一般化知能）」の実現までをトークします。

ぜひ、ご参加ください🙏https://t.co/0wZF6Cna2d
— Futurist（フューチャリスト） (@Futurist_SF) November 15, 2022

勉強

【ソニー社内講演】拡散モデルと基盤モデル

まさにGPT-3とStable Diffusionの基盤モデルとしての強さを最大限に活用してますね。それではこちらをご覧ください（宣伝）https://t.co/s72pcvTe0G
— mi141 (@mi141) November 21, 2022

Huggingface タスクページ

あらゆる機械学習のデモ、ユースケース、モデル、データセットがまとまっているみたいです。

the @huggingface "Tasks" page is an internet gem

go from clueless -> competent re: text-to-img generation, object detection + all the big AI breakthroughs

w/o any technical bghttps://t.co/K8b9AoNkRK pic.twitter.com/BU2xRfuuFV
— Peter Levin (@peteralevin) November 20, 2022

最後に

Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

Tweets by Yamkaz

画像生成AIの実験, 最新情報のまとめはこちら

過去の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます

日刊 画像生成AI (2022年11月21日)

開発