【11月はやばかった】次のステージに突入してしまった生成AI界隈の動きにみんなついてIKETERUNO??
わたしはついていけてなくて焦っています。
必死でフォローしているのですが、ここ最近の動きは特に異常です。
ちょっとopenAIのゴタゴタに注目している間にいろんなことが起こっていたのをみなさんご存知ですか?
わたしが理解できてる範囲でここ最近起こった出来事を簡単に整理していきますね。
2023年10月6日 LCMが爆誕
正式名称はlatent-consistency-model。
これはリアルタイムで入力したプロンプトが画像に反映されるという魔法みたいな技術。0.5秒で4枚出力しちゃうらしく、通常のStable Diffusionの5倍とのこと。
2023年11月9日 LCM-LoRAが爆誕
このLCMがLoRA形式で公開されたことで身近になり、AI術師の皆さんが次々と試していき一大ムーブメントに。
それにより、LCM/LCM-LoRAを活用したツールが次々と登場
このLCMを活用してリアルタイムに書いた落書きを変換していくというのがとにかくすごかったので、わたしもKritaでのリアルタイムお絵描きを試していました。
noteにもまとめた件ですね。
そんな素晴らしい体験ができるツールを技術者の皆様がどんどんアップデートして、よりすごいものを発表してくださっています!!
(一旦日本の方のポストに限定しています)
そんななか、また別ですごいものがリリースされました…
2023年11月17日 Japanese Stable Diffusion XL (JSDXL)
英語版SDXLをベースにした日本語のプロンプトで生成できるモデルをStablelity AI社がここぞとばかりに発表。
もう英語にわざわざ翻訳しなくていいんや!というありがたいモデル。
どんどん便利になっていく世界。すばらしい。
デモも公開されているのでぜひ試してください。
と、日本語で静止画が作れるなんてべんりだな、なんて喜んでたのもつかの間で下記のリリースです。
2023年11月22日 Stable Video Diffusion公開開始
驚きですね。動画生成のためものすごいモデルが公開されちゃいました。
これの何がヤバいかというと、動画にしたときの品質です。
いままでも動画生成の技術はありました。
でもなかなか設定が複雑な上に、綺麗に出力するのが本当に難しかった。
そんなところにこのStable Video Diffusionはめちゃくちゃ高画質な動画を出力してくれるというのに加え、Stablelity AI社の理念によりもちろんのことオープンソースです。
たくさんの方がいま試していらっしゃるのでぜひその品質をご覧になってください。
もう、映画つくれてしまうのでは…?
ちなみにもうcomfyUIで試すためのcustom nodeが有志によって公開されています。すごい世の中だ…
追記:11/25に公式でサポートされました!
みんなこの「リアルタイム高品質お絵描き生成の戦い」と「高品質ビデオ生成の戦い」についてIKETERUNO??
いやはや、すごいですね。
ちょっと今年ってどうなってんの?だれがコロナ明けこうなるって予測した?
わたしは10月後半にこのような記事を書きました。
そこでこんな風に締めくくっています。
いやいやいや、たしかに一か月前に高品質静止画の戦いはてっぺんが近づいてる~みたいなこと言ってたけど、こんなに早く戦い終わる??
気が付いたら「リアルタイム高品質お絵描き生成の戦い」と「高品質ビデオ生成の戦い」に入っちゃってました。
進化が早すぎてもう何が何だかですが、だからこそ情報を追うことをあきらめないようにしたいと思います。
がんばろう、みんな…!!
この記事が気に入ったらサポートをしてみませんか?