AIアートと人間の不可解

2022年12月3日 03:22

注:
※私はイラストレーターではないです。

最近クリスタからこういったニュースがあった。

12/6（火）に無償公開するVer.1.13.0で「画像生成AIパレット」の試験的な実装を予定しています。
今回の実装にあたりセルシスはユーザーデータをAI学習用に一切提供しておらず、今後もユーザーの明確な同意なしにデータを収集・利用することはありません。https://t.co/rhjDfSFuRo pic.twitter.com/hACKPxPtkB
— CLIP STUDIO PAINT（クリスタ） (@clip_celsys) November 29, 2022

「おっ、クリスタも生成モデルに手を出したのか～」と思っていたところ、批判殺到で開発中止になったらしい。

皆様からいただいたご意見を重く受け止め、CLIP STUDIO PAINTへ画像生成AI機能を搭載しないことといたしました。
皆様に新しい創作の体験をしていただきたい、という想いで開発を行いましたが、体験してもらう以前に、必要な配慮が欠けていました。https://t.co/7GEUORby4O pic.twitter.com/5QN2Ij4cmC
— CLIP STUDIO PAINT（クリスタ） (@clip_celsys) December 2, 2022

このニュースを聞いたとき、正直「なぜ？」という疑問が湧いた。自ら絵を描くことのできる人間こそ、生成モデルの恩恵が最大限受けられるのではないか？と。

今日のインターネット上では、なぜか画像生成モデルは悪として扱われることが多いように感じる。
「なぜか」とは書いたものの多少事件があったのは筆者も記憶している。NovelAIリリース直後あたりには「生成モデルが学習データをほぼそのまま吐く（要約）」みたいな恣意的な炎上騒ぎがあったし（意図的にそういう設定にしなければこのような現象はほぼあり得ないというのは今では周知の事実であろうが）、TwitterでイラストレーターにAIで完成させたイラストを送りつけるバカがいたりした。

ただし、これは「技術が悪いのではなく使う人間が悪い」の典型でしかないだろう。これを理由に、画像生成モデルは良くないとは結論づけられない。

じゃあ、なぜ多くの人間は画像生成モデルを嫌うのか？
それが目下の疑問である。

ちょうど色々生成モデルについて思うところがあったタイミングで、上の記事を読んだ。いささか口調が攻撃的ではあるが、内容自体は概ねその通りとしか言えないだろう。この記事にある種触発されて、今この記事を書いている。

先ほど記事に添付したクリスタのお知らせに記載されていたユーザーからの意見を見つつ、今の自分の意見を書いていこうと思う。

1.「誰かの著作物を利用しているから使いたくない」について

要約せずに原文を以下にそのまま記載する。

現状の方式の画像生成AIが、著作権を侵害していなくとも、誰かの著作物を利用して画像が生成されており、その由来が不明であるアプリは使いたくない。

https://www.clipstudio.net/ja/news/202212/02_01/（2022-12-03参照）

生成モデルが著作物を利用して画像を生成している、という事実の認識自体は何も間違っていない。

「誰かの著作物を利用して」という部分は具体的には「誰かのイラストを学習して」という文に置き換えることができると思うが、そうすると疑問が生じる。

人間のイラストレーターも、他のイラストレーターが書いたイラストを参考に「学習」したり、あるいはイラスト以外の解剖学の資料を参照したりする。これは生成モデルの「学習」と何が異なるのだろうか？

もしかしたらまだ「生成モデルが既存の画像を切り貼りして新しい画像を生成している」なんて理解をしている人がいるかもしれないが、それは大きな勘違いである。

イラストが生成される過程こそ人間と機械（例えばDiffusion model）では大きく異なるが、学習の過程は似た行為ではないか、と思う。（そもそもニューラルネットワークは名前の通り人間の脳を模してできた理論である）
それならば、なぜ人間の学習は許されて機械の学習は許されないのか。現在の世論はダブルスタンダードになっているように感じる、というのが私の意見である。

2.「学習データセットがクリーンでない」について

同様に原文を掲載する。

倫理的に問題がない方法で収集されたデータを利用していないのであれば、使えない。

おそらくこの意見は、NovelAIなどの学習にDanbooru由来のデータセットが用いられたことを念頭に置いているだろうと想像される。ここでは、この意見を「転載サイトのデータを利用して学習するのは反対」という意味と解釈しておく。

結論から言えば、別にデータをどこから収集してこようが本質的な問題にはならない。

ここではDanbooruを例にして解説する。
Danbooruは、インターネット上に無料で一般公開されているイラストに自由にタグ付けができるサービスである。（ゆえに、fanboxなどのコンテンツは含まれない）
そして、それらのほとんどはTwitterかpixivに由来するコンテンツである。

NovelAIが公開されたくらいの頃、「Danbooruに転載されるから生成モデルの学習に利用される」といった主張をTwitter上で見かけた気がするのだが、この主張は大いに間違っている。Danbooruがあろうが無かろうが、インターネットにイラストを公開した時点で無条件で学習に利用される可能性がある。

Danbooruが使えなくなったら、Twitterかpixivから直接イラストを保存してくればいいだけである。得られるデータは結局同じなのだから、全く同様にしてモデルの学習ができる。

そんな勝手に学習に使っていいのか、と思うかもしれないが、少なくとも現行の法律では（日本やアメリカでは）合法である。合法でも倫理的な問題があるのでは、という疑問については、先ほどの「人間がイラストを学習するのと機械が学習するの何が違うの」という問題に帰着するだろう。

画像以外の生成モデルとの比較

現在OpenAIによるChatGPTがTwitter上で流行している。

ChatGPTも、同じく生成モデルの仲間である。

ここで話題としたいのが、学習データの話である。
ChatGPTは自然言語処理をするモデルであるから、その学習データセットの一部として大量のテキストが利用されているでろう。

当然、そのテキストは誰かしらが書いたものであり、もしかしたらなんらかの書籍由来のものも含まれているかもしれない。

そうすると、これはイラストを学習して作られた画像生成モデルと、全く構図が同じである。
言葉を借りれば、「誰かの著作物を利用して」文章が生成されている、ということ。

しかしながら、ChatGPTは全く批判を受けることなく、むしろ大衆に受け入れられているように見える。見える、というより事実と言っていいだろう。

なぜ？　イラストだけが特別なのだろうか。
まあこれはおそらく半分合っていて、半分間違っている。

インターネット上、特にTwitterのような場所では、今日イラストが書ける人が持つ影響力は凄まじい。イラストを生む能力というのは確かに一朝一夕で身につけることができる技術では無いし、誰もが持っている能力ではない。特別な能力である。

しかし一方で、神格化されすぎている部分があるのではないかとも思う。

特に機械学習について勉強したことが無いイラストレーターが画像生成モデルについて発言したとしても、それが民意になってしまうだろう。これは、いち技術者として見ていてあまり気分の良いものではない。私も機械学習について研究をしているわけではないし、逆にイラスト側について詳しいわけでもない。しかしながら、生成モデルについてあまりに事実と異なる理解をされているところをみかけると、思うところはある。

画像生成モデルへの批判は当然正当なものもあるだろうが、その背後には論理ではなく感情が先立っているようなものも多いように感じてしまう。

おわりに

ざっくり、現在の生成モデルとそれに対する人間の関わり方について自分の意見を述べてきた。

反対意見がある方は、ぜひ教えて欲しい。この記事に触れる形で記事を書いてくれてもいいし、Twitterのリプライでも良い。

書こうと思っていたけど今回は含めなかった内容も多少あるので、もしかしたら論理の飛躍を感じた部分もあるかもしれない。もう少しマシな文章が書けるように精進したい。

この記事が気に入ったらサポートをしてみませんか？