画像生成AIをめぐる人と人の対立と、今後の仕切り直しについて

日々のAI革新を見ながらまとまらなかった考えを月末に。

画像生成AIと呼ばれる技術の始まり方、世に広まる最初のスタートはやはり不幸だったと思う。今やネットは技術論以前に、その技術を巡って人と人の対立が激しさを増している。その対立を煽ることで利益を得る人たちももちろんいる。

例えば初音ミクや、それからボーカロイドボイスロイド、CEVIOなどの音声合成AIで対立がここまで激化しなかったのは何故かというと、(もちろんそうしたものにも批判や反発はあったにせよ)きちんと学習元と契約を結び、これがAIであると表明し、いくつかの規約や制限のもとに文化を形成してきたからだ。たとえば『可不(KAFU)』はV系アーティストの花譜さんの声を機械学習したソフトで、発売時にはファンから反発や不安もそれなりに見た。だが『可不(KAFU)』のユーザーからは花譜さんにリスペクトが払われているし、花譜さんの活動も阻害されてはいないように見える。

これがいきなり「Youtubeで歌ってみたを上げてる歌手の声を勝手に学習しました」「他にもこの機械学習モデルにポンすれば人気声優や有名歌手の声を勝手にコピーできます」というモデルの流出から技術が世に知られ、有名声優から一般人の声までが振り込め詐欺や勧誘に使われうる状態になり、音楽や演技にまったく敬意を払わない人々が「これは産業革命だ」「もうあいつらはいらない」「こっそり使えばバレない」と公言して憚らない状態からシーンがスタートしてしまっていたら、そりゃ音声合成の世界もめちゃくちゃに荒れていただろうし、ボカロ文化が産んだ多くの才能を素直に迎えられない人たちも多く生まれていただろう。例えば米津玄師がハチという名前でボカロPとして活動を始めた時、彼が使った声が初音ミクではなく、宇多田ヒカルやSNSシンガーの声を無断で機械学習した音声だったら、その作詞作曲の才能の評価とは別に凄まじい感情的な対立と反発の中に巻き込まれていたのではないかと思う。彼のソングライターとしての才能を認めることは無断学習の肯定になるから認めないという人たちと、彼の才能を無断学習を肯定するための盾に使う人たちの対立の中に立たされていただろう。言わばそれが画像生成AIの現状でもある。

逆に言えば、画像生成AIに対する今の反発の半分くらいは、「今ある生成モデル」に対する反発ではなく、「将来にわたってあらゆる絵描きの個性を勝手にコピーし、誰でも制約なしで使えるようになる」という、学習元に対する制限のかからなさなのではないかと思う。
画像生成における初音ミクのように、既存アーティストとのコンセンサスを結んだ上で「描けない人が表現したいものを表現できる共有AI」というあり方は可能だと思う。もちろんいらすと屋がイラスレーターの仕事を激しく奪ったように、パブリックユースのできる「萌え絵いらすと屋」だって市場を食ってしまうことはありうる。しかし少なくとも、どんな新しい才能が出てきても1週間後には機械学習されてばら撒かれるようなことは防げるし、「これはパブリックユースの絵だな」と判断することができる。

もちろんそうした試みもすでに行われていて、ツイッターで大学研究設備を使った?あるふ@alfredplpl 氏のclean diffusionやpicasso diffusionなどが公開されている。しかし、最初に無断学習で公開されたnovel aiとそのさらなる海賊版としてばら撒かれた無料版があまりに強力で広まっていないのも事実だ。まだ発音が未熟な初音ミクの誕生から育児のように寄り添い、ソフトと作り手と受け手がゆっくりと歩くことができた音声合成の世界は幸福だったのかもしれないと思う。

しかし、方向性としてはそっちしかない、全面禁止も、無法地帯も現実には難しいのではないかと思う。明確なラインは引きにくい。揚げ足を取ろうと思えばどんな線引きも難しくできる。しかしその曖昧な文化的ラインしか落とし所はない気がする。

画像生成AIが公開された当初、「日本人は新しい革新に感情的に反発して海外に負ける」と言われていたが、今や海外の方がAIに対する批判や抵抗運動が強い。これは欧米が一見するとネオリベ的な資本主義に見える一方で、それと呼応するように労働組合や社会運動の力もまた強い。

「これは新たな産業革命であり、反発はラッダイト運動(機械打ち壊し運動)のようなものだ」と、画像生成AI公開当初に勝ち誇るように語る人々がいた。どうせ最後は時流に流されるのだ、と言わんばかりに。極めて率直に言うと、僕はその辺のAI山師みたいな人たちが単純にあまり好きではない。あらゆる所で「これは革命だ、乗り遅れると大変なことになりますよ」と煽ることでビジネスを広げるこの人たちが対立と反目を深くしている面もあると思う。しかし彼らはそれこそ対立と反目で儲けようとしているのだから言っても意味はないかも知れない。

産業革命は単に、機械の歯車が回るたびに自動的に繁栄と平等を社会に持ってきてくれたわけではない。長時間労働や労働者の酷使、撒き散らす公害に対する人間の抵抗と歯車の両輪になって今の社会がある。画像生成AIに対する海外アーティストの反対運動には、単なる守旧的な拒否反応ではなく、そうしたタフな抵抗と交渉の歴史があると思う。

とりわけハリウッドでは俳優組合が強く、これはAIの合成俳優とかなり衝突する可能性もある。本格的な「交渉」はまだこれから始まるわけで、産業革命だから受け入れろ、逆らう奴はしょせんラッダイトみたいな言説は微妙だ。

一方で、画像生成AIに対する反対運動があまりに潔癖になり、闇雲な新技術の拒否に傾きすぎてそれを使うアーティストへの個人攻撃が激しくなると、逆に運動としては脆くなり、離反者も増えると思う。
日本のアニメ・マンガ技術は質量ともにあまりにハイレベルになりすぎた。天才ではない若い世代にとって、今から絵の練習に人生を捧げても先達の天才どころか、商業作の最低レベルにたどり着くことさえ容易ではない。そうした後からくる世代にとって、画像生成AIによる作画補助が魅力的に見えることは想像に難くない。そういう「描けないけど表現したい」という人たちをある程度は寛容に受け入れることも、最終的には絵を描く文化の裾野を広げ、絵師と文化へのリスペクトを高めるのではないか。そういう意味でも、日本のボカロ文化は幸運な、そして幸福なモデルケースだったのだと思う。

最終的に画像生成AIに関してはどこまでを許容し、どこまでを退けるか、観客・読者側の文化の問題になるのではないかと思う。デジタルで合成できるからなんでも駆逐されるのかというとそうではなく、例えばピアノという楽器は基本的には一つひとつの鍵盤の音の合成でできているわけだから、別に高度な人工知能がなくとも鍵音を合成すれば名人のピアノ音声を超えることは理論上できるはずだ。しかしそれでクラシック界が震撼したり、ピアニストが絶滅するかというとそうではなく、それは人は人に出会い、人を評価するという文化があるからだ。

そうした文化、価値観という草の根から立ち上がったものが法制度として結実するのが理想なんだけど、有料マガジン部分では画像生成AIに対する赤松健先生、山田太郎先生のスタンスについて思うことを書きたいと思います。

ここから先は

1,225字
絵やイラスト、身の回りのプライベートなこと、それからむやみにネットで拡散したくない作品への苦言なども個々に書きたいと思います。

七草日記

¥500 / 月

絵やマンガなどの創作物、WEB記事やTwitterに書ききれなかったこと。あとは映画やいろいろな作品について、ネタバレを含むのでTwitt…

この記事が気に入ったらサポートをしてみませんか?