画像生成AIの未来

はじめに

昨年あたりからStable DiffusionなどのAI画像生成ソフトウェアやNovel AiなどのAI画像生成サービスが多数公開され、凄まじい勢いで普及していると同時に、学習元にされた(される)可能性のあるイラストレーターとの間で大きな反発や軋轢を産んでいる。
一時は大手ペイントソフトに画像生成AIが組み込まれたものの、ユーザーから猛烈な反発が出て開発者が謝罪、撤回に追い込まれた。さらに現在では画像の中に、AIが学習しにくいようなノイズを混ぜ込むことで学習を妨害するというソフトも開発され始めている。AI対絵師という対立軸がかなり鮮明になってしまっているのだが、この状態ははたしてどの方向に進むのかを考える。
先に画像生成AIの未来についての考えを提示しておくと、『AIの普及はもはや避けられず、無断学習にかかわる軋轢は世代交代によって押し流される』というのが現時点での予測である。
なぜそうなるのかを説明していく。

AIと法

画像生成AIの多くは、ウェブ上にアップロードされた画像にタグ付けされたものを機械学習にかけ、その結果できたベースモデルとプロンプト(いわゆる呪文)から画像を生成する。一部では『学習した画像の要素をキメラ的に組み合わせている』という誤解があるがこれは正確ではなく、学習された画像はもっと細かく咀嚼されている。AIが行っていることは、人間がたくさんの画像を見て、そこに学びながら絵を描くのに近似している。人間との違いは学習や生成の速度と量が桁違いであること、そして人間は絵以外の体験からインスピレーションを得ることができるということだ(たとえば音楽から絵画を着想した画家がいる)。著作権法関連の弁護士からは、公開された画像を無断で学習して作製されたモデルを使って画像生成しても、著作権法には触れないという見解が提示されている。学習された画像は数十万枚にもわたり、誰の絵から学習されたのかはもはや不明であるから、現実問題として特定のイラストレーターがAI生成画像に対して『自分の絵を盗作された』と主張するのは難しいだろう。
しかし、現行の法律に抵触しなければ何も問題がないかというと全くそういうことはない。そもそも現行の著作権はAIがない時代に生まれたものであり、当然AIの存在を想定していなかった。また、法律というものは法の理念や哲学に基づいて法理論的に導き出されるという要素がある(大陸合理論やドイツ観念論に基く大陸法寄りの考え方)。一方で法律というものは社会的な合意を明文化したものであり、結局は社会の受け入れ方次第という考え方もできる(イギリス経験論に基く英米法寄りの考え方)。いずれにせよ、議論の進み方によっては規制が強化される可能性もあれば推進に傾く可能性もある。だから現行の著作権法だけを見て判断するのは、事態を単純化しすぎた議論である。
ひとつ間違いないのは、AI技術は間違いなく社会のありようを大幅に変化させるということだ。ChatGPTは欧米ですでに普及しはじめているし、日本は政府が積極的に活用したいと言っている。米軍はAI搭載型戦闘機の実用試験をすでに行っている(米軍だけではないだろう)。そして画像生成AIも既に広まり始めている。

AIとオープンソース

AI画像界隈では、無断でモデルのマージやプロンプトの借用が行われているが、ほとんどのAI利用者は自分が公開したモデルやプロンプトは他のユーザーに利用されることを前提として公開している。人からモデルを借りてマージモデルや画像を作ったとして、そこに独占的な権利を主張することは常識的に考えられないからだ。ある意味ではお互い様の前提で他者の制作したモデルを利用し、逆に他者に利用される前提で公開しているのである。これはオープンソースの考え方である。
オープンソースはそもそもGNUやLinuxなどのソフトウェア開発の中から生まれてきた考え方だ。それまでのクローズドなソフトウェア開発と異なり、不特定多数の人間が一つのソフトウェアの開発に関わり、成果の多くが無償で共有されてきた。公開されたものを無償で利用してよいかわりに、何か改造した場合はそのソースコードを公開するという原則は、ギークの間では広く普及しており、そのルールとして代表的なものがGPLである。ある意味ではユートピア的な互恵的制度であるが、一般に思われているよりも社会に影響を及ぼしている。世間一般では、GNUやLinuxなんて自分は知らないし使ったことないから関係ないと言う人が大半だろうが、いまやそうも言っていられない。androidはそもそもLinuxベースであるし、自分はiPhoneだから関係ないという人でも、世界中のサーバーのかなりの部分がLinuxで動いており、インターネットにアクセスすればほぼ必ずLinuxサーバーのお世話になるからだ。つまりインターネットを利用する人はほぼ確実にオープンソースのお世話になっているわけである。そうである以上、もはやすべての人間が否応なくオープンソースの恩恵に与り、巻き込まれていることになる。
そしてAIの開発者には、オープンソース的思考傾向の強い人が多い。すなわち、インターネットで公開されたものは二次利用されるのが当たり前という思考である。誤解のないように言っておくと、画像生成AIの開発者、および学習モデル製作者の多くはもちろんデッドコピーや無断商用や盗作が問題であるという原則は認識し守っている。しかしAIで生成したものはデッドコピーでも盗作でもないし、著作権法にも問えないというのが現行法のひとまずの結論であるから、一部の例外を除けば法に問えない。だから彼らの多くは公開された画像を学習に利用しているのだ。もちろん違法でなくとも炎上することはありうるため、彼らの多くは匿名であるが、それも一種のリテラシーである。
現状、問題になっているのはむしろ感情的な部分である。つまり絵師にとってみれば、自分の描いた絵を勝手に学習されることが納得いかないということだ。これは感情的な問題であるが、しかし感情的な問題は無視されるべきではない。そもそも法律というのはそうした感情的な対立に対しても一定の裁定を下すことを求められるものであるから、法律と感情論は完全に切り離すことができないのだ。
また、ペイントソフトにAIが搭載されたとして、誰が描いたのかわからない大量の画像から学習したAIを使って描いた画像が、本当に自分の作品と言ってよいのかという疑問が残ってしまう。これは感情的な問題であると同時に著作権にも影響を及ぼしかねない。先ほど『現行法では著作権法に問えない』と書いたがあくまで現行法ではという枠組みであり、今後どうなるかは成り行き次第である。

AIの活用例

かくも明確に対立してしまったものは容易に解消できるものではないし、専門家でもない筆者が解決策を提案できるものでもない。しかし科学史、技術史を含めて歴史に興味がある人間として、将来どうなるかを考えてみたい。
改めてAIという技術について考えてみる。AIは、今まで生み出されてきた技術と同じように、有用である、役に立つという点については異論はないだろう。そして社会に対して変革をもたらし、そこには有害なものも含まれ、社会の反発も生じ、それに対しては法規制や他の技術によって緩和されるだろうという点にも反論はほとんどないだろう。自動車が生まれたことで移動が飛躍的に楽になり、モータリゼーションが進み、交通事故や環境問題が出現し、法規制や環境技術が発展したのと同じだ。もちろん影響の程度ではAIのほうが圧倒的に速く、大きいだろう。そしてこれらは、画像生成AIについても同じことが言える。
画像生成AIの有用性としては、何より短時間で速く画像を生成できるということだ。そうなると現状で需要がありそうなのはプロ用途である。具体的には2Dテレビアニメとマンガである。

AIとアニメ制作

2Dテレビアニメの1話ごとの作り方は、キャラクターに絞れば、おおまかに脚本→絵コンテ→レイアウト→第一原画→第二原画→動画→色指定→彩色→撮影という流れで進む(厳密には随所に作監チェックが入る)が、このうち彩色については、すでに線画から色塗りを行う技術は存在している。時間軸での統一性だけクリアできれば実用可能である。動画の一部もAIに置き換えることができる。画像生成AIは特定の画風を再現することが得意なので、作画監督の仕事も削減できる(動画原画を減らした結果として逆に作監の仕事が増えてしまう可能性は否定できないが…)。また、将来的には中割(原画と原画の間を補完する作業)もある程度AIがやってくれるだろう。アニメーターは人手不足なので、ワークフローが確立すれば(確立するまでが大変だが)、AIが救世主となるだろう。
なお、実用例としてアニメ制作を挙げたのには理由がある。画像生成AIには著作権の問題が常につきまとうが、アニメ制作現場はこれをクリアするための条件が部分的に揃っているということだ。
画像生成AIは数十万枚という大量の画像を学習してベースモデルを作る必要があるが、現状ではそれこそネットの画像を無断で学習するなどグレーな方法に頼っている。しかしアニメスタジオは大量の画像を持っているから、すでにあるアニメの画像を自社用AIの開発のために使用することは不可能ではない。
さらに、現状の画像生成AIでは画風やキャラクターの特徴を学習させたLow Rank Adaptation(=LoRA)という技術が存在する。これは数十枚の画像を学習させるだけで、特定の画風を再現したり、特定のキャラクターを出したりすることができる技術だ。これは少数の学習で済むから、アニメ1作品ごとに作ることが可能である。ざっくり言えば、1クール分のデータがあればキャラクターや画風の学習元としては十分であるから、そこから学習させれば2クール目以降が作りやすくなるだろう。AIは再現するのが得意だからだ。もちろんAIも手や指など苦手なところがあるが、そこは人が補正すればよい。少なくとも大幅な省力化が期待できるところではある。
なお、学習させる画像にタグ付けをしなければ学習元データとして機能しないが、現状では画像を判別して自動的にタグ付けしてくれるAIも存在する。その技術も今後発展していくはずであり、人間がタグ付けする必要はほとんどなくなっていくだろう。
もちろん、過去アニメの画像を学習させるとしても、アニメの著作権はアニメスタジオだけに所属するものではない。実際には製作委員会の構成メンバー(たとえば原作の出版社、レコード会社、広告代理店など)はもちろん、現場のアニメーターにまで及ぶ可能性もあり、学習に使用するとなればそれぞれの同意が必要になるが、それでも不特定多数によって描かれた画像を学習するよりも権利関係がクリアである。過去の作品を遡って学習させるのが困難なのであれば、今後作るアニメの契約の際に『AIに学習させる』旨をはじめから明記しておけば将来的に活用できるだろう。そう考えれば、今後は製作サイド(製作委員会など)が主導してAI活用を行っていくと予想される。

AIとマンガ

画像生成AIのもう一つの活用場所がマンガである。マンガもアニメと同様に、短期間で大量の絵を書かなければならないという特徴があり、そこにAIを活用できる余地がある。
マンガの制作過程は作家ごとにかなり異なるが、おおまかに言ってネーム→下描き→ペン入れ→ベタ、トーン、効果線などのように進む。現在はデジタル化が進んでいるので、背景はレイヤーを分けて並行作業するのが普通であろうか。マンガ制作ソフトにAIを入れるとすれば、たとえば下書きの工程でアタリをとったら自動的にポーズ人形を出してくれる、ネームの粗い線から下書きを描いてくれる、下書きから輪郭線を描いてくれる、仕上げ処理をやってくれるなどが期待できる。この場合、ワークフローとしては
作家がネームを書く
→AIがポーズ人形を出し、作家が調整する
→AIが下書きの選択肢を提案し、作家が選択調整
→AIが輪郭の選択肢を提案し、作家が選択調整
→AIが背景や効果線の選択肢を提案し、作家が選択調整
などのように進むことになるだろう。
もちろんこだわりのある作家は『ここは自分でやりたい』という人もいるだろうから、そういう人はやりたいところだけ自分でやればよい。それによって個性を維持できるわけだ。
ここまでの検討ではすでに出来上がった学習モデルがあることを前提としているが、実はAIの使い方はそれだけではない。たとえば、ペイントソフトに組み込んだAIが、作家のペンの挙動を逐一モニタして学習していくことで、作家のクセを学んで成長するという使い方も想定することができる。つまり作家がAIを調教することで、自分の画風を再現するAIを生み出すことができるわけだ。この場合、学習データが流出すれば画風をパクられる可能性があるためリスクはあるが、しかしたとえば腱鞘炎で以前と同じ絵が描けなくなった太田垣康男のような作家にとっては福音となるのではないだろうか。もっと言えば、作家が手を酷使して腱鞘炎になるリスクが減るかもしれない。

AIと絵師

ここまで見てきたように画像生成AIは、うまく活用すればアニメ制作やマンガ制作の省力化に貢献し、人手不足を解決できるかもしれない。と同時にわかるのは、完全にAI任せということはありえず、ワークフローの中にどうやって組み込んでいくかが重要である、ということだ。つまり画像生成AIは、現状では絵描きを代替するなどということはなく、絵を描く上で強力な味方となってくれるだろう。Pixivで公開する絵ひとつとっても、アタリからポーズ人形を出してくれたり、下書きを提案してくれたり、塗りを支援してくれたりしたらかなり楽になるだろう。AIを使ったらみな没個性的になるという懸念もあるが、そうしたワークフローが確立しても、個性的な絵を描く人はむしろこだわりたいところを自分で描き込むだろうし、そういう個性を持った人が目立ちやすくなるだろう。

未来

究極の問題はやはり、どうやって学習元の権利関係をクリアしていくかという点である。
冒頭で述べたように、現状、AI界隈と絵師界隈は深刻な対立がある。おそらくこの状況が緩和することは当面ないだろう。だが、歴史的な視点で見ると、これらの問題は世代交代で解消すると予想している。
いまPixivなどで絵を公開している人のボリュームゾーンは10代後半~30代くらいの世代だと思われる。しかし、現時点でまだ絵を公開していない10代前半より下の世代は、すでにAIがある世界で育っているから、AIに対する忌避感はおそらく少ない。
もし彼ら(=次の世代)が、『他人の画像から学習したAIを組み込んだペイントソフトを使って絵を描くのが当たり前』『自分が公開した画像がAIに学習されるのが当たり前』というオープンソース的価値観の中で育ち、新世代の絵師となっていけば、そもそもAI界隈と絵師界隈の対立は徐々に消えていく。
その場合、今度は上の世代(=現在絵を描いている世代)との間で価値観の違いによる対立が発生する可能性が高い。すなわちAI反対派の現役世代の絵師と、AI活用派の次世代の絵師の対立である。ここではわかりやすくするために単純化したが、AIに対する態度は、実際には絵師たちの中でも複雑である。ただ少なくとも、次世代の絵師たちのほうがAIに対して親和的であろうことは予想がつく。
すなわちAIネイティブ世代と上の世代(現在の絵師たち)との対立が予想されるのだが、基本的に世代交代というのは上の世代が退場していくことで解消されるものであるから、将来的にはAIに学習されることを忌避する人も一世代ぶん、つまり30年程度の時間をかけて減っていくのではないだろうか。
冒頭で『無断学習にかかわる軋轢は世代交代によって押し流される』と書いたのは、そういう意味である。この予測が当たるか否かは、それこそ30年経ってみないとわからない。そのときまで生きて見守っていきたい。

この記事が気に入ったらサポートをしてみませんか?