AIイラストが創作ではなく引用の一形態であることを示す思考実験

 イーガンの『ゼンデギ』というSF小説の短い紹介から始めます。それは、一言で言えば「脳そのものを学習素材とし、脳活動を出力する生成AI」の話です。それは数千のドナーの脳神経の構造を平準化した基幹部分と、LoRAのように特定の個人を模倣する部分からなります。
 これによって、特定の人間の人格そのもののエミュレートができます。人格LoRAです。作中では精度が低く完全なコピーではないのですが、そこは今回の本題ではありません。

 さて、この人格コピーに絵を描かせたら、著作権侵害は起こるのでしょうか。ある絵師Aさんのコピー、A′さんの描いた絵はAさんの著作権や著作者人格権を侵害するのでしょうか。
 しないですよね。もちろんそれ以外の問題は山積みです。人格のコピーや遺伝子的なクローンは人道的に問題があります。しかし、A′さんの描いた絵はA′さんのオリジナルです。

 イラストAIユーザーが主張するのは、生成AIは法的に、このA′さんのような存在であるということです。ここではLoRAがほぼ違法であること、LoRA以外は特定の作家に特化していないことは問題としません。たとえば複数の絵師A~Zさんの脳データから平準化された絵師人格Ωさんのようなものとしてもよいです。Ωさんの描く作品は著作権侵害ではありません。
 めでたしめでたし。
 というわけにはいかず、問題は、イラスト生成AIは人格生成AIではないということです。人格生成AIは脳機能の一部として「絵を描く機能」を保持していますが、イラスト生成AIは実はそれを保持していません。入力されたのは50億枚の画像だけです。学習元の作品そのもの、パターンを抽出し重複した無駄な部分を捨象することで、サイズを数万分の1以下にまで損失あり圧縮した、情報が削減されたデータベースです。それはモデルと呼ばれており、これが先ほどの例でのΩさんです。学習元の著作物そのものからなるデータベースをXとし、モデルをX′とします。
 モデルとデータベースは違うだろと思うかもしれませんが、生成物の多様性はデータが削減されたことによるぼやけ、例えるならばある鮮明な画像にかけるモザイクのパターン数のようなものです。オリジナルは一つでも、ぼやけさせるパターンは無数にあります。モザイク化することで情報が削減されているのに、かえって多様に見えるのです。これが単にデータベースを検索しているのではなく、新しく生成しているように見える理由です。
 このモデルにプロンプトを打ち込んで得られる生成物は、Xというデータベースから絵を一枚検索するのではなく、Xに統計的処理を施したX′からの検索となります。拡散モデルのノイズが擬似的なランダム性を持ち込んでいるとはいえ、X′はXの復元を目指す関数を基幹にしています。
 人格生成AIが「描いている」のは自明ですが、このイラスト生成AIのモデルが「描いている」思ってしまうのは単なる擬人化です。どうしても「描いている」「描いてもらった」と呼びたくなるのは仕方ないですが。
 パターン抽出による圧縮のせいで情報が削減されているので、検索結果が定まらない検索、それがイラスト生成AIの「描いている」ように見える動作の正体であり、つまりそれがしているのは不完全な「検索」なのです。

 著作権侵害かどうかは、最終的な生成結果である生成物の類似性や依拠性ではなく、このモデルを目的論的に見て決めたらどうでしょうか。モデルは「検索」された学習元を、「復元」しようとします。しかし保存されているのは削減された情報のみなので、結果は不完全で歪められたものになります。生成AIにおける創造性とはハルシネーションの別名です。
 これは広範囲の著作物の改変ではないでしょうか。
 開発者やユーザーの目的がなんであれ、モデルの目的は「描くこと」や「創作」ではないことがわかります。また、単なる道具ではなくコンテンツの集積です。(たとえば生成AIに可能な出力をすべて列挙すれば、それは道具ではなく画像集になります)
 モデルは元画像群を検索し復元しようとするが失敗し、その結果をユーザーはオリジナル作品として発表します。生成AIの創作とは検索の失敗です。これらのことはLLMに置き換えてみればはるかにわかりやすいはずです。LLMのハルシネーションはまるで検索が失敗したように感じると思います。
 こんな感じで、なんとか著作者人格権の侵害に持っていけないかな?なんとかなれー しらんけど。
 もちろん、AIイラストを自作品としてではなく「無断収集したイラストデータベースからの応用統計学的引用」と明記して発表するなら、なんの問題もありません。それは色々な統計的処理を経た「引用」なのですから。

 今回は、完全に「オリジナルを描いている」といえるAIを想定したことで、それと比較して現状の生成AIがそれとは根本的に違うという話でした。

この記事が気に入ったらサポートをしてみませんか?