世界変革の前夜は思ったより静か

深津貴之 (fladdict)

2022年8月22日 02:30

世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。

あと数日（から数週間）で「トップレベルの画像生成AI」が、世界中にフリーで配布される。

イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。

凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。

そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。

Stable Diffusion

公開されるAIの名前はStableDiffusion（サービス名はDreamStudio）という。

いま流行のMidJourneyよりも高性能で、本家DALL-E2に近い性能。5.6Billion枚（から選出した2Billion、100TB）の画像でトレーニングした汎用画像AIだ。このAIが、ソースコードからモデルまで、景気良く世界に全公開されるのだ。

こういった超AIは、OpenAI（DALL-E2）やGoogle（Imagen）など、メガベンチャーが総力をあげて開発したものの、「社会への影響が大きすぎる」として、一般には公開されてこなかった経緯がある。

そんな中、過激なまでにオープン思想を追求したのがStability.AIと愉快な仲間たちだ。

StableDiffusionを作っている人々の思想は、とてもピュアだ。

「すごいAIを、一部の大企業や個人が独占するのは健全ではない」「AIは全世界の人が平等に使えるようになるべきだ」そんな思想で動いている。

だから「AIを世界に無料で公開しちゃいますね」と。

このチームはあまりにピュアすぎて、「機能制限」や「セーフフィルタ」のほぼない、なんでも作れちゃう基本モデルを世界に無制限に公開しようとしている。

予定では、StableDiffusionの公開版は、ほぼ機能無制限かつ、普通のM1 Macのローカル環境でも動くスペックで無料配布される。

社会はどうかわるか？

予測できるといいのだが、これがさっぱりわからない。変数が多すぎて読めない。

このAIが世に出れば、創作の世界は大きくかわることは確かだ。商習慣、制作工程、マーケットサイズ、社会的価値…あらゆるものが、数年内に大転換を強いられる。

確かにまだ精度には限界はある。でも、今回の公開は確実にパラダイムシフトを起こす蟻の一穴となるだろう。フリーで公開されたモデルをベースに、さまざまな画像生成サービスやツールが、雨後の筍のように生まれてくる。画質やクオリティの問題も、ムーアの法則的な加速度で解決していく。

あらゆる小説やゲームに豊富な画像がつくかもしれない。非実在ポルノが大量発生して、現実のポルノが縮小するかもしれない。制作工程ひとつとっても、最終作品を作る部分ではなく、資料やパーツ、テクスチャや背景を生成するだけで、大きく変わってくる。

こういった変革は、グラフィック系の対岸の火事ではなさそうに見える。

Stability.AIは、同じようなフリーAIを、音楽と映像と3Dでも公開しようと考えているからだ。遠からずプログラミング、文章、ファッションなども、似たような状況になるのではないかと思う。

下記は、ビデオにStableDiffusionを応用した実験らしい。

Video production and #AI: text-to-video adaptation#StableDiffusion just goes into beta and gives third-party developers access to its model, RunwayML implements this functionality into its video editor pic.twitter.com/qaJMNfX7E3
— Phygital+ (@phygitalplus) August 21, 2022

初期画像から誘導するガイド。

話題のStable Diffusion、テキストから画像再生するだけじゃなくラフ画を清書する機能まで付いててヤバイ

もう企画書で画像に困ることは無くなるな… pic.twitter.com/95FxCqOSZ5
— ひろはす@ゲーム開発情報発信 (@hirohasusan) August 22, 2022

どんな画像が作れるかもっとみたい人は、↓なども参考に。

実践的な命令文の作り方は、こちらの記事が。

今後の流れがどうなるかはわからない。ラッダイト運動が起きるかもしれないし、著作権法が改正されるかもしれない。EUが規制をかける流れもありえるし、逆にGoogleやAdobeが参入してくるかもしれない。いいことも、悪いことも、混乱と衝突を起こしながらたくさん起きていくのだろう。

ただ確実に言えるのは、今後もAIはさまざまな専門職能を強制的に民主化していくこと。そして、この流れが非可逆であることだ。

どういう時代になるにしろ、ガラケーにこだわってスマホに乗り遅れた人のポジになるのが一番怖い。まぁ、新技術の常として、大山鳴動してネズミ一匹の可能性もあるけれど。

ただ、どうせ変化するならば、最前線で遊ぶのが一番楽く、また生存率が高くなるように思える。僕は比較的に楽観的（Stability.AIの人ほどではないが）なので、こういう展開にドキドキしながらも期待をしている。

あらゆるインディーズゲームやカードゲームの品質があがり、誰もが新しい世界を作ることに参加できるようになることは、とても素晴らしいことにも思える。そして従来の創作も、活版印刷や写真やCGの試練をくぐり抜けてきたわけで、このAIの試練もなんだかんだで乗り越えたり、取り込んでいけるのではないかと思う。

そんなことを考えながら、ちょうど仕事でAI関係に触れる機会もあり、ここ数ヶ月いろいろと試している。

AIに描かせた、「新しい時代の到来を祝福するメチャクチャ太った猫の神聖で素晴らしい油絵」#dalle2 pic.twitter.com/oybOQFxM3k
— 深津貴之 / THE GUILD / note.com (@fladdict) July 3, 2022

＜追記＞
いくつか、うまく伝わってないことがあるので補足。

どう革新的なの？

これは刀剣に対して、銃が出現したに近い状態。絵画や剣術は「身体能力と認知能力の高度な複合体」で、長時間を投資しても確率的にしか極められないものだった。

一方で、銃の出現は、「子供でも老人でも女性でも、武力100の武人を倒し得る」ようにする。それも超短期的なトレーニングで。そしてムーアの法則にしたがって、性能が時間とともに勝手に進化していく。

たしかに、銃器を持った子供はヘラクレスを殺し得る。ヘラクレスの最強性は相対的には弱まる。一方で、当面は「銃器を持ったヘラクレス」こそが依然として最強なことは重要なポイント。

銃が単なる武器を超えて、戦争のあり方はおろか、国家の構造や、人間の権利、治安など多くのものを変化させた。

現状はまだ活版印刷や火縄銃レベルの段階だが、ムーアの法則的な進化を考えれば、現状「まだ」と思われてる課題点は、ものすごいスピードで克服されていくと思われる。

フリーで公開される

「モデルとソースが公開される」から、「誰もが自分のPCで動かせる」までは、もうちょい時間がかかる。誰もがフリーに遊べるのは、誰かがモデルやソースをアプリケーションを作ったり、誰もがGPU搭載のPCを手に入れるなどは、もうちょい未来。

モデルとソースがフリーで公開しても、それを使った作られたサービスはサーバー代やGPU代が発生するので、必ずしもサービスが無料になるとは限らない。ただし、時間の問題で無数に競合サービスがでて価格競争が起きたり、無料提供のビジネスモデルが生まれたり、ローカルで動く無料アプリを作る人々は現れる。

Stable Diffusionのクオリティ

StableDiffusionは、MidJourneyより性能いいけど、「汎用」なので、キラキラした画像の一本勝負だったらアート特化のMidJourneyのほうが雑なプロンプトでもよい画像を出す。

AI絵画の著作権について

以下、自分の理解の範囲で（法律プロの解説がまたれる）。

汎用画像AIの著作権論点は、大きくわけて3つある。
「AIの学習は合法か？」と「AIの出力は合法か？」「AIの出力物に著作権は発生するか？」。

まず学習について。

「ネットの大量画像の学習」は現状は、個々の作品の著作権法にふれず、フェアユースであろうという解釈がある。英国や日本も、著作権法の例外規定で、AI学習への著作物利用は著作権違反にならないっぽい。この辺は、実際の判例がでないとわからない分野だけど、大きくはそんな感じ。（これから法が変わる可能性はある）。

つぎに、AIの出力の合法性について。

現状は、「合法」という想定で各社は動いている。著作権法の保護対象は、「個々の作品そのもの」であり、画風やコンセプトや構図は、著作権の対象にならない。加えて、「偶然に似通った場合」は著作権違反にはならない。ので、「特定のAI画像が、特定の絵を意図的にパクった」証明は非常に難しいと思われる。例外は、「ユーザーが意図的に特定の作品に似せようとしたことが命令文から明らかである」場合、この場合はユーザーが著作権違反に引っかかる可能せがある。

AIの出力物の著作権について

現状は、「AIがポン出しで生成した画像」は著作権は発生しない。なので、誰もが使えるパブリックドメインになる。著作権を発生させるには、出力画像を「フォトショで調整」したり、「命令文をなんどもチューニングしたり」「あとで描き足したり」することで、「人間の創作物」として著作権を発生させる方法が主流になると思われる。

初期の著作権まわりの混乱について
これは揉めると思う。法律というよりは感情面などで。難しいのは、「現在の法律」では合法っぽいこと。そして集団訴訟しようにしろ、MidJourneyもStability.AIも独立系スモールベンチャーなので、GAFAと違って集団訴訟がしにくい点。

歴史的な動きを繰り返すなら、ラッダイト運動や、労働組合によるボイコット的アプローチ（ハリウッドがバーチャルアクターにやってたような）が発生するのではないか。EUやUSが法律レベルでブロックをかける可能性もありそうだが、テクノロジーの公開は非対称かつ非可逆なので、難しいところ。（規制派は全てを漏れなく封印しなければならないが、オープン派は一箇所でも崩壊させれば成功なので）。

この辺は、自分を含めて制作職の人間にとっては、法律の問題だけでなく、感情や生き様、人生の投資時間、生存などさまざまな要素が複雑に絡む。簡単い合意はとれないし、簡単に解決する問題ではないと思われる。

いただいたサポートは、コロナでオフィスいけてないので、コロナあけにnoteチームにピザおごったり、サービス設計の参考書籍代にします。