日刊画像生成AI (2022年10月17日)

2022年10月18日 12:21

画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。

そんな中、毎日時間なくて全然情報追えない..！って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。

次の日に投稿するのが一番いいと思ったので17日分を先出します。
メインページの日付順が崩れますが正しい順番はマガジンにどうぞ
遅れた間の日付分は毎日少しずつ公開していきます。

過去の投稿はこちら

ピックアップニュース

Stable Diffusionを開発した会社「Stability AI」が17日、オープンソースの人工知能に1億100万ドルの資金調達を発表。

Emad氏「AIは人類最大の課題を解決することを約束します。しかし、この可能性を実現できるのは、技術がオープンで誰もがアクセスできる場合のみです。」

「Mostaque氏によると、今回の資金調達は、Stable Diffusionのカスタムバージョンをユーザー向けに大規模に展開することと、スーパーコンピューティングパワーの増強に投資することを支援するものだという。」

カスタムバージョンとは..アニメモデルか、V2の1024x1024のことなのか、それとも..何かとんでもないものがあるのかもしれない。

LightspeedがStability AIに投資した理由：ジェネレーティブAIを民主化するために

Stability AIに投資したのはCoatueとLightspeed Venture Partnersですが、Lightsspeedがブログで詳しく色々書いてます。知っておいた方がいい情報のみピックアップして紹介します。

私たちが提唱するジェネレーティブAIは、人物、ビジネス、アイデアなどに関するストーリーを語ることが、基本的に人間を人間たらしめているという信念から出発しています。しかし、良いストーリーを語ることは簡単ではありません。テキスト、画像、ビデオ、オーディオ、プレゼンテーションなど、「コンテンツの作成」が必要です。しかし、現在、コンテンツ制作のプロセスはマニュアル化され、困難なままです。

ストーリーを表現する美しい画像を生成するには、想像力だけでなく、芸術的なスキル、Adobe Photoshopなどのツールの知識、そして長年の作業とトレーニングが必要です。ジェネレーティブAIは、この「手作業」の多くを軽減し、誰にとってもより身近なものにする力を持っています。私たちは、ジェネレーティブAIが、エンターテインメント、メディア、広告、教育、科学、芸術など、ほとんどすべてのクリエイティブな活動を根本的に変える力を持っていると信じています。最終的に、Stabilityのビジョンは、テキスト、ビデオ、オーディオなどに同様の機能をもたらすことです。

1ヶ月足らずの間に、Dreamstudioのユーザーは150万人を超え、20万人以上のオープンソース開発者がStable Diffusionを使用しています。

私たちは、Stability AIが、AIの人材や計算資源、使い方をカスタマイズする能力を持たない企業や非営利団体、政府にとって、理想的なビジネスパートナーになると信じています。

開発

NovelAIの魔導書「元素法典」が話題に

NovelAIが世界中に拡散した結果、中国語圏においても呪文の研究が盛んに行われているらしく、昨日の夜中に「元素法典」と呼ばれる魔導書が発掘され、話題になっている

元素法典——Novel AI 元素魔法全收录https://t.co/4sTeDpQ9mS pic.twitter.com/MYDR0HEXqm
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) October 17, 2022

NovelAIで質がいいものを出せるpromptが詰まっている魔導書「元素法典」が話題になりました。なぜ日本で広まったのか。経緯はこれです。

なんU民が中華圏でクソ長ネガティブプロンプトを発見
→台湾ユーザーと繋がった一人が「元素法典」入手
→PDFにして125MBもの検証、マニュアル群の魔導書
→U民、全力で翻訳中と

4chでも5chWiki見てるぽいし、欧米、中華、日本で全力でNAI研究されてるの草。これでアニメ一本作れるやろ #NovelAI
— PROTO@AiArt (@proto_jp) October 17, 2022

翻訳版を作ってくださった方がいました。こちらです。

元素法典のpromptを使って精度の高い絵を出す検証をされている方がこの日は多かったです。ありがたい。いやクオリティ高すぎる。

元素法典つよつよすぎる#novelAI pic.twitter.com/XoANNmpFpo
— nemusugi021＠AI art (@X34XtSIyDux5zIQ) October 17, 2022

これが噂の元素法典のpromptか… #NovelAiDiffusion pic.twitter.com/BESnOheWqw
— Caren (@caren_eth1) October 17, 2022

元素法典参考にしてみたけどすごい(´◉◞౪◟◉)

NovelAIにて出力#AIイラスト pic.twitter.com/5ybu3A9g3d
— ゆっくり兵器解説＆ゲーム実況：エンドラⅢ (@endoraiii) October 17, 2022

中国のprompt集、『元素法典』からアレンジして使ってるけどこれは強力だ。 #novelAI #NovelAIDiffusion pic.twitter.com/LunfoyxUqN
— わたべ (@altnacchi) October 17, 2022

AIイラスト界隈で話題の #元素法典のネガティブプロンプトらしきものを共有します。画像はダミー。ALTを確認

なんと3000文字以上あって1つのALTには収まらないので4巻構成です。つなぎ合わせて大呪文にしてください。ご利用は自己責任で#NovelAI #NovelAIDiffusion https://t.co/ybBfpmWjPw pic.twitter.com/dA5QNiyqLa
— PROTO@AiArt (@proto_jp) October 17, 2022

NovelAIがメンテナンス完了。

NovelAIが一時的にメンテナンスで停止していました。インフラストラクチャに大幅な変更を加え、スピードアップも見込めるとのこと。さらに生成が爆発的に増えるかもしれない。

[#NovelAI Emergency Maintenance Complete]
The emergency maintenance has been completed.
We made significant changes to our infrastructure that should solve stability issues from the previous days going forward. As a result, you will also notice significantly improved speeds.
— NovelAI (@novelaiofficial) October 17, 2022

旧とりんさまキャラクターズモデル(Trinart)をオープンソース化

おぉ..ついにtrinartもオープンソースに。意外と2GBしかないらしいです。NovelAIもオープンソースになる予定なのでもう現状世の中に出ていない画像生成AIモデルはmidjourneyとdalle2。midjourneyに関してもシークレットプロンプトや、あのスタイルを適用する方法はかなり逆算されてきているのでオープンソースに近くなってきている。

#trinart 最新版のでりだモデルリリースに伴い、
旧とりんさまキャラクターズモデルのオープンソース公開を開始しました。
約1920万枚（事前オーギュメントによる「存在しない画像」を含む数字）で訓練された、構図力の高いAIアートモデルですッ！
詳しくは注意書きをどうぞ。https://t.co/mv7XnbPN9E
— Sta @ Bit192 / Tone Sphere (@naclbbr) October 17, 2022

Public PromptsでApp Icons Generator V1が公開。

prompt販売サイト、promptbaseを正しいと思っていない方が無料でかなり精度の高いプロンプトを公開し続けているpublic promptというサイトがあるのですが、そのサイトでアプリアイコン生成のDreamBoothが公開。

Gradioが公開リンクを16文字のbase64に変更。

https://www.reddit.com/r/StableDiffusion/comments/y64618/gradio_changed_their_public_links_to_16character/

Gradioはセキュリティの脆弱性をこの変更にて改善しました。割り当てたアドレスが簡単に推測、スクリプト化できてしまう点、webui リポジトリのバグが重なり攻撃の可能性が非常に高くなっていたそうです。

DreamBoothSD GUIが登場。

ついにDreamBoothできる人がかなり増えそう。DreamBoothができる2つ目のGUIが登場。Windowsで10GB VRAMで実行できるDreamBoothができるGUIが登場。NMKD Stable Diffusionでできるようになったら次の日すぐそれができるやつも公開された。勢いがすごい。

WebUI AUTOMATIC1111の知られざる便利機能

重みを変更したいプロンプトの部分を選択し、CTRL + 矢印を上下に動かして重みを変更することができるらしいです。

普通プロンプトの強弱をつけるために (((()))))、{{{{}}}}をつけたりするのですがそんなんでいけるんか！

画像からプロンプトを大量に予測するサイト latentspace.devが公開。

Spent last week building a tool that creates Stable Diffusion prompts given an image. It works decently well, see below.

It can suggest prompts even if no one has created a similar image before.

It’s been useful for me so might be for others too: https://t.co/N4XwBx7N0g :) pic.twitter.com/ZSpSzkhV6s
— Qasim Munye (@QasimMunye) October 16, 2022

やってみたけどこれすごい便利そう。prompt逆引き系colabは6つくらいあったけどそれを統合したものかな。colabノートブック起動せずできるの便利すぎるので嬉しい。

sd-multi

（これ注目されてないけど個人的に良さそう。）色んなStableDiffusionのフォークは全部すごいアクティブで進化しているが、たまに壊れていたりするからこうやってDockerで色々試せるようにまとめているとのこと。hlkyもamotileもautomatic1111も入ってる。

表現

未定さんのNovelAIアート

未定さんを発見して個人的おすすめなので見てもらえると嬉しいです。概念の意外な掛け算にひたすらチャレンジされていてとても興味深いです。（普通に生成されたやつも好きですが）ここが画像生成AIのポイントの1つだと個人的には思っているので素敵です

髪から泡へ遷移させる#NovelAI #NovelAIDiffusion pic.twitter.com/Z0dEUFhSZd
— 未定 (@msts_stu) October 12, 2022

髪から波へ遷移させる（北斎リスペクト）#NovelAI #NovelAIDiffusion pic.twitter.com/Md3CweGvJn
— 未定 (@msts_stu) October 11, 2022

触って感じたAIの強みは「全然関係のない別々の概念を合成できる」ということで、これによって「潜在的に存在した誰も見たことない表現」を生み出せる点だと思う。
これは卓越した芸術家が新しい表現を開拓するときに使う手法そのもので、コンピューターで超スピードに試せてしまうのはスゴイ。
— 未定 (@msts_stu) October 16, 2022

AIを画力が足りない人が流行り絵を真似て劣化コピーとして量産したいのか、AIを新たな表現の模索に使いたいのかで大きく変わるね。どちらの気持ちもわかる。倫理的な問題は解決しないといけないけどこの騒乱自体はとにかく興味深いし今後どこに行きつくのか気になってる
— Hirokazu Yokohara (@Yokohara_h) October 17, 2022

この「全然関係のない別々の概念を合成できる」「潜在的に存在した誰も見たことない表現」って話、そもそも画像生成AIを作った人たちがそういう風に使えって言ってたよね確か
— Hirokazu Yokohara (@Yokohara_h) October 17, 2022

すきえんてぃあ氏は8月30日に画風結合の例も沢山やられていたので紹介。
（スレッドにいっぱいあります。）

AI画風パクリが話題になってるけど、画風移植は2015年ごろには登場してた技術なので何を今更感があるし、それは置いといて注目したいのは【画風は混ぜられる】ということなんですよ。例えばこれは「ゴッホ＋ピカソ」と指示して出てきた新しい画風。パクるどころか踏み越えていく。 pic.twitter.com/90lKDyz66z
— すきえんてぃあ@書け (@cicada3301_kig) August 30, 2022

たんぽぽの時計

https://www.reddit.com/r/StableDiffusion/comments/y5tk4b/a_dandelion_clock_experimenting_with_alternate/

DALL-E2で楽譜を生成。

https://www.reddit.com/r/dalle2/comments/y5m638/dalle_in_major_sheet_music_detailed_can_anyone/

研究

WebARで現実世界を部分修正（Inpainting）している事例

WebARで現実世界をStableDiffusionのinpaintingしている事例。
こうやって世界に落書きしていくARの世界楽しそうだな

Stable Diffusion inpainting in the real world 🤩. First experiment with Stable Diffusion and WebAR. #threejs #8thwall #stablediffusion #augmentedreality pic.twitter.com/dFq1sRoh43
— Stijn Spanhove (@stspanho) October 16, 2022

prompt2prompt検証

prompt2promptとはこれです。

Prompt-to-Prompt: Latent Diffusion and Stable Diffusion implementation with @huggingface diffusers is out

github: https://t.co/B4YcBt7vgo pic.twitter.com/QoIsax3xB1
— AK (@_akhaliq) October 16, 2022

11日には公開されていた非公式実装リポジトリに説明が書かれていたので紹介。簡単に説明すると普通のStableDiffusionだと求めている画像を出すのは時間がかかるし、ちゃんと求めたものを作るにはフォトバッシュワークフローみたいなのが必要で、一部マスクしてinpaitingで生成して合成してまた全体でimg2imgしてとかすごい複雑な工程いるけど、Cross Attention Control を使用するとマスクを入力しなくても、推論中に拡散モデルの内部アテンションマップを変更することで、プロンプトをより細かく制御できるというもの。

Izumi Satoshiさん、深津さんがやられているようです。

prompt to promptを触ってみている。プロンプトはalt
確かに同一性を保てるのはすごいけど、現状はtext2imgしかできないので、なんの役に立つのかいまいちわからない
img2imgへの応用も簡単にできるのかな？ pic.twitter.com/WcMLVvHxrO
— Izumi Satoshi (@izumisatoshi05) October 17, 2022

Cross Attension使ったPrompt2Prompt試してみたけど、実践に使うにはちとまだ重いかなあ。コードがあくまで検証用で、既存のコード群に組み込み辛いのと、P2Pが一段階なので、誰かが改造してWEBUIかDiffuserに組み込む待ち感
— 深津貴之 / THE GUILD / note.com (@fladdict) October 16, 2022

このリポジトリの中にcolabノートブックあったのでやりたい方はこちらに。（多分高速でautomatic1111に実装される。もう入ってたりしそう）

MidjourneyスタイルをStableDiffusionで得る方法

https://www.reddit.com/r/StableDiffusion/comments/y649yn/prompts_modifiers_to_get_midjourney_style_in/

64~100 ステップ以上でこのプロンプトと設定でこのスタイルが得られるとのこと。

Professional oil painting of establishing shot of canal surrounded by verdant ((blue)) modern curved rustic Greek tiled buildings, professional majestic oil painting by Ed Blinkey, Atey Ghailan, Studio Ghibli, by ((Jeremy Mann)), Greg Manchess, Antonio Moro, (((trending on ArtStation))), trending on CGSociety, volumetric lighting, dramatic lighting, (dawn), water, canoes, refraction

Negative prompt: amateur, poorly drawn, ugly, flat

Steps: 100, Sampler: LMS, CFG scale: 9, Seed: 918873140, Size: 704x512, Model hash: 7460a6fa, Batch size: 3, Batch pos: 0

Professional oil painting of establishing shot of canal surrounded by modern tiled blue curved African European fantasy buildings, professional (majestic) oil painting by Greg Manchess, Atey Ghailan, (Fenghua Zhong), ((Jeremy Mann)), ((((Greg Rutkowski)))), Antonio Moro, (((trending on ArtStation))), trending on CGSociety, dramatic lighting, (dawn), refraction, ((((Unreal Engine 5)))), rule of thirds

Negative prompt: amateur, poorly drawn, ugly, flat

Steps: 64, Sampler: LMS, CFG scale: 9, Seed: 3658904926, Size: 640x448, Model hash: 7460a6fa, Batch size: 3, Batch pos: 0

自分専用のStable Diffusion環境にリモートアクセスする方法

ローカルでStableDiffusionを起動して、Google Chromeリモートデスクトップでリモートアクセスする方法があるみたいです。こんな方法が！

はてなブログに投稿しました #はてなブログ
自分専用のStable Diffusion環境にリモートアクセスする方法 - karaage. [からあげ]https://t.co/grOqfHvHJ5
— からあげ (@karaage0703) October 16, 2022

NovelAIでシンプルな線画表現をする方法

{{{{{thick outline}}}}}, {{{{{black outline}}}}}がいいらしい。

#NovelAI Tips:
デフォルメ風のキャラ・イラストを出したいときは{{{{{{thick outline}}}}}},{{{{{{black outline}}}}}}がおすすめ。線が濃くなるだけではなく背景なども単純化される。 pic.twitter.com/yf91pFHdO7
— 逆瀬川 (@gyakuse) October 17, 2022

{{{{{{thick outline}}}}}},{{{{{{black outline}}}}}}完全に理解した#NovelAI pic.twitter.com/rsmicicfln
— かりみや (@Callimiya) October 17, 2022

sabakichiさんのこれもそうかもです。違ったらすみません。

デフォルメ系のイラスト、「抽象的な省略は人間じゃないとできない」的なツイートをみてから気になっていたのだけど、工夫すれば割とできることを発見した#NovelAI #NovelAIDiffusion pic.twitter.com/Vhvuf5f1Wv
— sabakichi｜Domain ✍︎ (@knshtyk) October 16, 2022

ScottieFox氏のStable Diffusion VRのざっくり解説

数日前に話題になったこの人です。バッググラウンドでDeforumとTouch Designerを使っているとのことでしたがどうなのか..

Thank you for all the support during my projects! It means a lot to me. I have decided to include a small gift to you all! A 360° YouTube upload of one of my test worlds for you to enjoy.https://t.co/tUDsItphIR #aiart #vr #stablediffusionart #touchdesigner #deforum pic.twitter.com/vbLjOywog8
— ScottieFox (@ScottieFoxTTV) October 16, 2022

思想・ムーブメント

Midjourneyコミュニティフィードから丸パクリして商品に貼り付けて販売してる男がいます。

https://www.redbubble.com/de/people/leviprime/shop

Midjounrneyはコミュニティデザインがうまく、基本課金4000円程度に加え、2000円程度を払わないとプロンプトと生成画像を隠せません。なのでMidjourneyコミュニティフィードに大体の美しいアートは存在してるのですが、そこでプロンプトもコピペできてしまいます。要するに一瞬で気づかれにくい形でパクれる。指摘されたらだって「--chaos 100」とか指定したらある程度全然違う表現になるのでむずいですね..。本当に超独自性のものしか生き残れなくなるのか。むしろ平面絵はこれまで以上に圧倒的に飽和してしまうということなのか。「誰かが生成したもの」というものは価値がなくなり、全員が自分用に生成する時代になるのか。

この日の気になるツイート紹介

人間は30歳までに10^25Flops程度の学習をすると見積もられている。そして現状の大規模AIモデルは最大10^24Flops程度。
2倍になる期間は10ヶ月程度。なので4年以内（2026年まで）には人間レベルの学習量に到達する可能性が高い。https://t.co/4QZmvInqA5
人間レベルの知能がすぐに誕生する可能性あり。 pic.twitter.com/9l9dR8lPTn
— bioshok(INFJ) (@bioshok3) October 16, 2022

これ、そこ(人間と同等の学習)が到達点ではなく単なる通過点に過ぎないところが恐ろしい.. https://t.co/fXKXBuRFnU
— Jun Rekimoto : 暦本純一 (@rkmt) October 17, 2022

学習量におけるムーア則が成立している... あっというまに「人の一生の1024倍の学習量」とかの時代になってしまうｗ
— Jun Rekimoto : 暦本純一 (@rkmt) October 17, 2022

AI絵だが、本来、10年間で進歩すべき技術が、1ヶ月で起きてしまって、10年かけて起きる諸問題も1ヶ月で起きてるので、正直、議論、法制度、諸問題の整備が、まったく追いついていないというのが最大の問題だと思う。
— 鐘の音（除夜の鐘）＠C101ダイエット-35kg (@kanenooto7248) October 17, 2022

なろう小説にAI挿絵を入れてるのを見つけて、ああこれは強いなって。
絵が描けなかった野良作家が自作に絵を入れられるようになった感激は、ボーカルを入れられなかった野良作曲家がボカロで歌を入れられた感激と、同質のものだと思います。
悪用しなければ良いものなんですよ。
— あけのん (@akenon0531) October 17, 2022

絵のプロやプロに近い人は、プログラマーや経験者に頭を下げてAIイラストを真っ先に勉強するべきだと思うのだが、
何故かお絵かき村は長老会議と村の若い衆を焚きつけることしかしてない
— かりみや (@Callimiya) October 17, 2022

AIの流れを見てると、絵を描く人と、物語を作る人は統合されて、「世界を作れる人」が増えていくのではなかろうか。
— 深津貴之 / THE GUILD / note.com (@fladdict) October 17, 2022

AI絵だが、本来、10年間で進歩すべき技術が、1ヶ月で起きてしまって、10年かけて起きる諸問題も1ヶ月で起きてるので、正直、議論、法制度、諸問題の整備が、まったく追いついていないというのが最大の問題だと思う。
— 鐘の音（除夜の鐘）＠C101ダイエット-35kg (@kanenooto7248) October 17, 2022

界隈の魔女狩りや私刑濃度が濃くなってきてて、「あ、これ鉄腕アトムで見たやつだ」って気分になるなど。やはり真に恐ろしいのはAIではなく、人類…
— 深津貴之 / THE GUILD / note.com (@fladdict) October 17, 2022

この樋口円香が描かれた絵ですが、服が波打ってるのにロゴが平面。もし令和の神絵師だったらこういう描き方はしないんです。お爺さんには申し訳ないですが、AI絵です。でも、この絵、樋口の特徴を捉えていて、良い仕事をしてるんですね。スマホのロック画面にしたりと日常的に使ってあげてください pic.twitter.com/NG3pYv901W
— 田中透 (@tanaka_tooru_) October 17, 2022

結局AIは誰かの絵を切り貼りして作ってるから、元となった人と似た絵柄が爆発的に増え嫌悪対象になった時、元の絵も嫌悪の対象になりかねないのと、元なのにAIと絵柄や塗りが似てるという理由で、あなたの絵ってAIですよね？という発言をくらう、というのも被害の一つとしてあるよなって。
— yapo (@yaponishi) October 17, 2022

最後のyapoさんの発言で最初の前提「切り貼りして作っている」が違うのでここの認識は正しくしたほうが良いです。仕組みの記事はいっぱいありますがリプ欄に載ってたこのtoggetterまとめをとりあえず。

AIイラストの普及で起こる深刻な事態は、労働問題ではなく、環境問題であると思う

生産速度がAI＞手描きである以上、ごく近いうちにネット上の絵や写真の総数を超えてAI画像の方が氾濫し、画像検索も使えなくなる。

繁殖力の強い外来種が現れて、生態系から多様性が失われていく事を進歩とは言わない https://t.co/2gyY38kJny
— 篠房六郎　BOOTH、とらのあなにて「ポーズの定理」発売中 (@sino6) October 16, 2022

勉強

松尾豊先生の講演

松尾豊先生の講演(2022年8月10日)

キーワード：GPT-3、基盤モデル、AlphaFold2、AlphaCode、トランスフォーマー、自己教師あり学習、スケーリング則、PaLM、DALL-E2、CLIP、Imagen、拡散モデル、Gato、リザバー計算、宝くじ仮説、強い宝くじ仮説、Double Descent、Grokkinghttps://t.co/4ATWqXxSto
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) October 16, 2022

最後に

Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。
よかったら見ていただけたら嬉しいです。

Tweets by Yamkaz

画像生成AIの実験, 最新情報のまとめはこちら

過去の号はこちら

次の号はこちら

サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます

日刊 画像生成AI (2022年10月17日)