![見出し画像](https://assets.st-note.com/production/uploads/images/87851336/rectangle_large_type_2_acb9f46a3af8e018e52ff9fea5ff23fd.png?width=1200)
日刊 画像生成AI (2022年9月26日)
画像生成AI界は、今認識できないスピードで進化をし続けています。
DALL・E2公開、Midjourney公開、StableDiffusionがオープンソースで公開されて..進化の速度が上がり続けており、日々異常なスピードで変化しています。
![](https://assets.st-note.com/img/1664364557634-vtree20I8t.png?width=1200)
そんな中、毎日時間なくて全然情報追えない..!って人のために業界変化、新表現、思考、問題、技術を毎日あらゆるメディアを調べ、まとめています。
諸事情で投稿が少し遅れています。ごめんなさい。
なんとか戻します。
昨日までの投稿はこちら
開発
Stable Diffusion 1.5v公開間近(?)
以前2022/9/25に1.5vを公開することを示唆する投稿があったため待機しておりましたが、1.4vのとき同様少し遅れている様子です。(ちなみにWaifu Diffusionの次のバージョンも公開が遅れています)
Not quite cooked yet.. getting there.. 🦃 #HappyNewYear https://t.co/u55cmMC2UY
— Emad (@EMostaque) September 25, 2022
Emadさんが返信くれました。
推しからメッセージがきたような喜びを感じました。
![](https://assets.st-note.com/img/1664300736492-TSTl7zV1Vw.png?width=1200)
NovelAIが次々開発経過を発信。
25日の方でも紹介していましたが、ひたすら投稿が続いているため連続でご紹介。これは要注目です。Waifu Diffusion、Trinartよりはるかに綺麗なアニメ絵描画ができるStable Diffusionの微調整モデルをNovelAIというサービスをされている組織が開発中です。
It's merely an aspect the AI decided should go there if prompted with "masterpiece portrait of smiling rem, re zero, caustics, textile shading, high resolution illustration". Like a random number, every single generation will be different. Not all will be signed, either: pic.twitter.com/dRX1pJGues
— NovelAI (@novelaiofficial) September 26, 2022
The power of the 1chibi tag in #NovelAI's wip Imagegen model!!!😭💗 pic.twitter.com/vYYPLAaSZY
— Aini (@Ainiwaffles) September 26, 2022
タグ付けすれば、体的なデザインのアイデアを維持しながら、キャラクターの外観を簡単に変更できるそうです。DreamBoothクオリティで色んなキャラクターができてしまうのすごいですね..Stable Diffusion 1.4v単体だと全然ここまで行かないのでただただすごいです。
Tagging also makes it simple to alter the appearance of a character while keeping the same overall design idea in mind. Switch things up on the fly!
— NovelAI (@novelaiofficial) September 25, 2022
Male, female, well-endowed, less-endowed, thin, chubby, older, younger, hair ... no hair? It's all up to your preference! https://t.co/BXHMnaikdz pic.twitter.com/xe1NaKxn7I
getimg.aiがDALL・E2に似たOutpainting(StableDiffusion)を開発中(Waitlist登録あります。)
![](https://assets.st-note.com/production/uploads/images/87852035/picture_pc_acfdc106008c4858e1684e096cf1b2a3.gif)
WebUI(by AUTOMATIC1111)の現状搭載の2種類のOutpaintingだとDALLE・2のOutpaintingのような自由度はありませんが、同じレベルで利用できるサービスをgetimg.aiが追加するとのこと。これは便利すぎる。1週間ほどでベータ版が公開できそうとのこと。また他にもアップデートはあるようで以下に記載。
getimg.aiアップデート内容
・一度に最大 4 つの画像を生成できるようになりました
・キーボード ショートカットと生成タイマーを追加
・よくある質問を書きました - UIを少し更新しました
・書き換えられたバックエンド – V100 GPU を備えた自分のクラスターで実行されるようになりました
・すべての NSFW フィルターを無効にしました
Waitlist登録はこちらから、上のメニューのoutpaintingへ飛んで下さい。
ローカルと接続して動くStableDiffusionが使えるDiscordbotが開発。
![](https://assets.st-note.com/img/1664366159806-6MavIudAWk.png?width=1200)
4900x800画像を1stepで、生のStable Diffusionで生成する。しかも512x512以上のメモリを必要としない!?
すごい、どういうこと..。fourier-shaped noise out-painting for latent diffusion models (stable-diffusion)がこれを可能にしているとのこと。g-diffuser-libの機能のようですが、まだ利用できません。もうすぐ利用可能とのことです。また、マルチモダリティ サンプリング機能を使えるようにするとのことで、txt2music、music2imgも数ヶ月で実現するとのこと。
![](https://assets.st-note.com/img/1664366450247-Y5aKK1F9PG.png?width=1200)
4900x800 image created in a single step with no manual editing, and no memory requirements beyond those for 512x512.
— Christopher Friesen (@parlance_zz) September 26, 2022
This is the power of fourier-shaped noise out-painting for latent diffusion models (stable-diffusion): pic.twitter.com/tFjtpolphA
アニメ顔を認識していい感じ512x512に切り取るスクリプト
Izumi Satoshiさんが顔認識で画像に切り取ってくれるcolabノートブック制作されていました。メモ。
#Dreambooth #stablediffusion
— Izumi Satoshi (@izumisatoshi05) September 26, 2022
アニメ顔を認識して、いい感じに512x512に切り取ってくれるスクリプト。Dreambooth用に作った。テスト出来てないけど多分動く。余白白埋め方式と結果が変わるのかは気になるところ。
同じことができる既存の何かがあれば教えてください。https://t.co/PyZiNsbLTY pic.twitter.com/yxBbaPccaW
表現
Minecraft Greg Rutkowski風テクスチャパック
MinecraftのテクスチャパックをStableDiffusionで制作した方がいらっしゃいました。おそらく元のテクスチャをimg2imgして、Greg Rutkowski風にしていると思われます。自分の好きなようにゲームのデザインを変えていけるような時代が来そうですね。
prompt:
a 2d texture by greg rutkowski" Steps: 15, Sampler: DDIM, CFG scale: 8, Seed: 2334514109, Size: 512x512, Model hash: 7460a6fa, Denoising strength: 0.38, Mask blur: 4
![](https://assets.st-note.com/img/1664448102634-EYoqWsCDFZ.png?width=1200)
![](https://assets.st-note.com/img/1664448105466-ijQHbTd6tn.png?width=1200)
![](https://assets.st-note.com/img/1664448109024-ezArFus1hL.png?width=1200)
ゴッホ風テクスチャもこの方は作られていました。これは楽しい。
prompt:
a 2d texture, by vincent van gogh Steps: 40, Sampler: DDIM, CFG scale: 30, Seed: 2334514109, Size: 512x512, Model hash: 7460a6fa, Denoising strength: 0.5, Mask blur: 4
![](https://assets.st-note.com/img/1664448322862-kNG4Rsz8Qg.png?width=1200)
![](https://assets.st-note.com/img/1664448325542-kXqpqNmP8F.png?width=1200)
AIに自分の個人情報を伝えてみました。
バズっていたのでメモ。これと似ている事例として、友人も自分の名前を入れたら自分ぽい人が出てきて面白かったと話してて、なるほど..と思いました。CLIP内で名前っぽい感じの羅列や、こういうプロフィール文はプロフィール画像と近いんだと思います。
AIに自分の個人情報を伝えてみました。 pic.twitter.com/6WKJiECvQf
— 根本。(ちんちんバスターズ) (@nemotossw) September 25, 2022
Asura - Night Hunter
Stable Diffusionで生成されたイラストを組み合わせて作られているようです。なかなかクオリティが高く、Redditでも伸びていました。制作者の方が試行錯誤せず、多くの画像を作るほどいいと書かれていて、なるほど..と思いました。
tasty_colorさん
「.. 最終的なアートができるまでに多くのステップがありました。… 試行錯誤しないこと、より多くの画像を作るほど、あなたが心に描いているものを得ることができる可能性が高くなります。」
![](https://assets.st-note.com/img/1664368876069-R4UI2cWOjD.png?width=1200)
![](https://assets.st-note.com/img/1664368899092-PhbKDKpE9Z.png?width=1200)
![](https://assets.st-note.com/img/1664368902933-UeLhwCFGX1.png)
この日のAIアニメーションセレクト
毎日よかったAIアニメーションを紹介するコーナー。この日はこちら。
Still trying to dial in settings:#stablediffusion #warpfusion pic.twitter.com/eq5D1kWnTX
— Euclid (Hueman Instrument) (@EuclideanPlane) September 26, 2022
pretense of serious conversation, the pic.twitter.com/aDzwywdhOh
— Artificial Bob (@ArtificialBob) September 26, 2022
GM🍄🔊
— 🅺🆄🆂🅷 (@MetaMushrooms) September 25, 2022
What are your favorite ways to stay creative in the art studio?
⚡️#portraits #AIArtwork #WIP #artistsontwitter #AIIA pic.twitter.com/W0hYC0o4Fm
Ballerina pic.twitter.com/igK4ZjrWEe
— Glenn Marshall (@GlennIsZen) September 25, 2022
videoの各レイヤーごとにimg2imgしていて、それが変化していてかっこいい。既にPVなどで複数活用されているのでもう海外では全然新しくなさそうです。
Dust pic.twitter.com/JQuqqcqaAq
— Personality (@got_Personality) September 26, 2022
僕もやっているので見てね
Creatures in the forest #stablediffusion #DeforumDiffusion pic.twitter.com/rzbSr9xVcm
— やまかず (@Yamkaz) September 29, 2022
研究
Waifu Diffusion で効率的に画像を生成する
Waifu DiffusionというStableDiffusionを改良したアニメ特化モデルについて、詳しく網羅的に記載されています。
![](https://assets.st-note.com/img/1664450275920-2Ysox7Rgr6.png?width=1200)
![](https://assets.st-note.com/img/1664365317917-jNRsO2tuzz.png?width=1200)
StableDiffusion追加学習の記録
Stable Diffusionの情報をかなり高度に追われている方の一人、海行さんがSDの追加学習の記録を公開してくださっています。
ひとまずSDの追加学習を開始する所まで手順をメモした。明日の朝まで待って成功してたら続きを書く。失敗してたらやり直し 22/09/26 Stable Diffusion追加学習の記録 https://t.co/dlH7WE5EZe
— 海行プログラム (@kaigyoPG) September 26, 2022
あぶぶさんのフォトバッシュワークフロー
#StableDiffusionKawaii SCP-682へのインタビュー pic.twitter.com/nMLP5dmAvz
— あぶぶ@健全 (@abubu_newnanka) September 25, 2022
making pic.twitter.com/gQYKplaNyd
— あぶぶ@健全 (@abubu_newnanka) September 26, 2022
思想・ムーブメント
Is This The Death of VFX?
Corrider crewというアメリカの制作スタジオのYouTubeチャンネルでは、DreamBoothが使われています。DreamBoothは、モデルにすでにある知識をすべて台無しにせず、新しい一貫した知識を与えられる方法です。かなり再生数が回っているので多くの人にDreamBoothが知れ渡ったかもしれません。
最初は一人の男性で検証されていましたが、途中からオフィスを回っていろんな人の顔写真をとり、DreamBoothで壮大なファンタジー物語を作られています。
![](https://assets.st-note.com/img/1664452477674-NecdZxS3Qx.png?width=1200)
![](https://assets.st-note.com/img/1664452478294-h0xRATg8ch.png?width=1200)
友達でDreamBoothとかやったら楽しそうだなって思いました。
![](https://assets.st-note.com/img/1664452654819-Pk9odF8YDS.png?width=1200)
![](https://assets.st-note.com/img/1664452676334-xEU2rEeUXw.png?width=1200)
![](https://assets.st-note.com/img/1664452658670-BDD7I4Y1hA.png?width=1200)
![](https://assets.st-note.com/img/1664452686567-PYVrSgYI0Y.png?width=1200)
![](https://assets.st-note.com/img/1664452700761-HXPzhjLoDE.png?width=1200)
![](https://assets.st-note.com/img/1664452756309-9xCx1jYDDb.png?width=1200)
![](https://assets.st-note.com/img/1664452762635-0aUrbNZJpq.png?width=1200)
水溜りボンドさんか、すしらーめんりく君が最初にやりそう。
もしyoutuberの方だったり、こういうのしたい人いたら声かけてください。
全然手伝います。
AIで生成した画像を使ったデマ投稿
![](https://assets.st-note.com/img/1664206395554-TtdmE0Uz0Z.png?width=1200)
https://twitter.com/kuron_nano/status/1574121450860007424
この日、大きな注目が集まることがありました。台風15号による静岡県の水害についてTwitterでAIで生成された画像でデマを流した方がいらっしゃいました。本人は謝罪し、大した目的はなかったとのことです。
拡大したらAIで生成された画像だと分かりましたが、小さいサイズで画像を見ると意外と分からないもんですね..。ちょっと一部出そうと思っていたnoteを投稿するのが怖くなりました。
この度の騒動について、いくつか聞かれたことについて回答いたします。
— くろん (@kuron_nano) September 26, 2022
誠に申し訳ございませんでした。
また、この投稿においてはリプライの制限をなくします。 pic.twitter.com/Eqf3Kqqs2r
なんかAI生成でデマだろといわれる洪水画像があんまり綺麗にできてるんでホントにこんなん生成できるんかなと思って自分でもやってみたら意外とできてしまった。1枚めと3枚めがよくできてる
— (Ǝ)ɐsıɥıɥso⅄ ouɐɓnS (@koshian) September 26, 2022
ホントにエセ画像見破るの難しい時代になっとるなあ pic.twitter.com/qbIKeFtzDx
デマ画像のAI生成に対する法整備なんかいらないよ。10年も前からphotoshopが動詞になって実写と見分けのつかない改変ができてるんだから。写真が事実の証明になる時代は終わったのよ。
— 尻P(野尻抱介) (@nojiri_h) September 26, 2022
他の方法、マルチモーダルな情報解析から真偽を判定する技術などが発達してきてるので、そっちに引っ越そう。
デマを通報する欄が中々難儀した。
— ハマスホ (@hamasuho) September 26, 2022
全てのTwitterユーザー→スパム→その他→ここ大事1番下の「別のルールを選択する」→かなり下にスクロールして「誤解を招く情報」 https://t.co/LxmDeo8koe pic.twitter.com/UEo9N326Yz
28日のAbema Newsに出られてました。びっくり。
852話さんに家凸事件
一部の人にはお知らせしましたが、家凸ありました。過去自家通販をしていた頃の相手から住所を『買って』家に来たようです。口論になり警察沙汰ですが、メールDMに対する誹謗中傷爆撃みたいなものも同一犯の可能性が高いらしいです。消耗で各所ご迷惑おかけしています。いくつかお仕事お断りしました。
— 852話 (@8co28) September 26, 2022
主にMidjourneyでのAIを使った風景、アニメ絵の検証の投稿で一気に有名になった852話さんに事件が発生。Twitterの文章だけでは正確には汲み取れないと思いますが、凸者の発言曰く自分の創作物がデータセットに含まれているからお怒りになられているという感じですかね。個人的にはStable Diffusionの仕組みは人間がやっていることとかなり近いという理解なので、「データに含まれている」=「盗作」ではないのであまり理解はできませんが..。(そこで起こると人間に「俺の作品見たな!盗作だ!」って言ってる感じがします。)ただ、852話さんがこの怒っている方の名前か、その方の画像が大量に含まれている周辺の言葉をプロンプトで指定しまくっていて、かなりその方が長年築き上げてきたスタイルを奪ってバンバン生成しまくってるんだったら怒る理由は分かりますが、観測している限りそんなことはないと思っているので、僕は852話さんは悪くないと思っています。
凸者の発言としては「AI学習には自分の創作物が含まれていてお前は俺の盗作をしている」「だからお前の創作を俺も盗んでいい」「お前は俺に謝罪してこれから先俺の言うことに従え」「お前は世界の絵描きに謝罪しろ」「いい気になりやがって」「俺はお前の個人情報をばらまけるぞ」などでした。
— 852話 (@8co28) September 26, 2022
なんとかまた元気になってほしいです。
こちらに内容がまとめられています。
未来の物語 — 人工知能がビデオスターを殺す方法
最後に
Twitterに、毎日製作したものや、最新情報、検証を載せたりしています。よかったらフォローしてくれるとうれしいです。
画像生成AIの実験, 最新情報のまとめはこちら
前回の号はこちら
サポートいただけると喜びます。本を読むのが好きなので、いただいたものはそこに使わせていただきます