AIチョットワカル絵描きがイラストAIに対して思うこと

natsuki

2022年10月13日 05:12

(2023/7/14 追記　こちらのnoteはChatGPTもリリース前の2022年10月に書いたものです。絵や技術に関する前提知識は大きく変わっていませんが、現在では取り巻く状況は変わっていることを留意いただければと思います)

イラスト等画像を生成するAI全般について書いています。

結論から言うと、新しい技術は楽しいけど今よりはもうちょっと絵を描いた人の権利も守れる方向に行った方が良いのではないかなと思っています。

あんまり自由にしても最終的に誰も得しない感じになると思うので…

書いた人の簡単な自己紹介

・あの手の機械学習そのものが専門ではないが一応情報系がバックグラウンドの技術者
・副業的に絵を描く

あと、昔知財関係の講義を受けていたのですが法律ってむずかしいなって思いました！！訂正すべき箇所があればお教えいただけるとありがたいです！

AIについてのざっくりとした説明と所感

まず大前提として、現在の画像を生成するAIは、学習元に大量の人が描いた絵のデータを必要としています。そして、とにかくたくさんのデータが必要である都合上、ほとんどのアート作品やイラストが作者に（まあ間違いなく）無断で利用されてしまっています。

写真の発明もたくさんの画家の仕事を奪いましたし、新しい技術で職を失う人というのはいつの時代にもいるものです。しかし、今回これだけ話題になっているのには、この他者の作品を利用しているという性質と技術の分かりにくさがあるのだと思います。
ここではまずAIにあまり詳しくない人を想定して簡単な仕組みと思っていることを書いていきます。

-機械学習のごく基礎的な説明

この手のAIにまず共通しているであろう技術であるニューラルネット（以下NN）について軽く説明します。

ニューラルネットワーク(Neural Network)は文字通り神経細胞(ニューロン)のネットワークの意味です。

人間の脳の中には神経細胞＝ニューロンがたくさん(1000億個以上とか)あり、互いにつながり合ってネットーワークを作っています。そのネットワークをコンピューター上で簡易的にモデルにして、人間の知能を再現できたらいいな、というものが今日の人工知能の大元になっているNNです。

大元のアイディアは1940年代に発表されたものですが、たくさんの細胞のネットワークをシミュレートするのはコンピュータの性能があまり良くない頃には無理めでした。近年になってコンピュータの性能が良くなったことで、研究や実用が盛んに行われています。

脳の中の神経細胞は互いに軸索と樹状突起と呼ばれる部分で繋がっています。そして、神経細胞は他の神経細胞からの信号によって"発火"するとまた次の細胞に信号を送ります。
神経細胞と他の神経細胞との結合の強さが変化することで、他の細胞からどんな刺激が来た時に発火するかが変化し、ネットワークの動き方が変化します。この働きで脳では学習が行われていると考えられています。

NNでは神経細胞がノード、細胞間の結合の強さが重みに対応しています。
各ノードは[入力された信号]×[入力元との重み]の足し算の値を元に次の階層のノードに信号を出力します。

-一般的なプログラムとAI（NN)の違い

例として、白い背景に緑のピーマンが赤いリンゴがある画像が与えられた時に、その画像がピーマンなのかリンゴなのかを識別するプログラムを作ることを考えましょう。

人間はこんなの見れば分かるじゃん！なのですが、コンピューター上での画像のデータの扱いは画像の各ピクセルの色をrgb(赤、緑、青の光の三原色の値です。デジタルで絵を描く方にはこのあたりはお馴染みですね)の数字で表したデータで文字列であり、コンピュータはそんなに融通を聞かせてくれません。

色々な解決方法がありますが、例えば画像の中のrの値を足したものとgの値を足したものを調べれば、その画像が緑色か赤色かが分かり、ピーマンかりんごかが識別できるでしょう。

…というような手順が従来の、機械学習を利用しないプログラムです。

それに対して、この課題にNNを使おうと思ったら、まず画像とその画像がピーマンなのかリンゴなのかの答えをたくさん組み合わせのデータセットを用意します。これが学習データとなります。

データセットがうまく分類できるように重みを調整することができれば、新しいピーマンorリンゴの画像も識別することができるでしょう。…多分！！

従来的なプログラムとNNを使ったプログラムのイメージ。ちなみにNNの方も従来のプログラムと同様に機械的な処理を重ねて実装する

今回のような課題であれば、通常のプログラムを書いた方が簡単だし確実です。AIを使おう！っていう話は盛んですが、使わなくても実装できちゃう課題であれば使わない方が確実だしコストも安いかと。

では、どのような時にAI、NNを利用すると良いのでしょうか？先程コンピュータは融通を効かせてくれないと書いたのですが、通常の細かく指示を書いていくプログラムを書くことが困難な課題に対して活躍します。

色が決まっているピーマンとリンゴのケースなら簡単に解決できるのですが、例えば「人の顔写真を誰だか分類したい」というような課題ではどうでしょうか？
学習データさえ集めることができれば、NNはこのような課題にも役立ちます。

しかし、NNの扱いづらい特徴として、例えフルスクラッチ(=0から)でプログラムを書いたとしても出来上がったモデルの挙動はブラックボックス的になってしまうという点があります。作った人であっても。
ピーマンとリンゴの分類問題のような簡単な課題に対してであっても、学習が終わったNNが何を見て判断をしているのかの説明は難しいですよね。
「重みがこういう風になった」ということが分かっても、そこから色を見ているのか形を見ているのか、それとも両方を見ていてどちらをどれくらいの割合で重視しているのか、理解するのは難しいです。

さらにイラストAIの仕組みについてとても良い解説資料を公開して下さっている方がいたのでぜひ読んでみて下さい！Deep Learningの部分がNNだと踏まえていただけると少し良いかもです。

昨今のお絵描きAIの進捗が著しく、いろんな方に一歩踏み込んで知ってもらいたいと思ったのでその仕組みについて解説資料を公開します〜（先日の技術書典の本の内容です）。これからいろんな分野の方が押さえておいても良い技術だと思うので、仕組みから興味持ってもらいたいなーという気持です。(1/5) pic.twitter.com/p7iBSY7ma5
— まっくす (@minux302) October 1, 2022

ここまで枝刈りに枝刈りを重ねた簡素な解説でした。細かい部分に興味を持たれれば調べていただければと思います。

イラストとAIという観点で議論するにあたって重要かと思われるAI（NN)の特徴は下記のようになります。

・現代のAIは学習データが必要であり、写真のように絵と独立した技術ではない
・NNは従来的な逐一手順を指示したプログラムには難しい課題に対応できるが、その分実際何をしているのかは分かりづらい
・（各イラストAIがどう作られているかは詳細は分からないですが多分）学習データを直接保存しているわけではなく単純にコラージュを作成するようなプログラムではない

-AIは本当にコラージュ的な出力をしないのか

シンプルに画像を組み合わせた出力を出す、という実装をされているものでも無いですし、学習に使ったデータセットが保持されているというわけでもありません。
モデルにあるのはトレーニングされたパラメータなわけで、確かに技術者が「コラージュじゃないんだからクリーンなはず！」と主張しがちなのも分かります。

しかし
①本当に切り貼りしたコラージュのような出力が無いとも言い切れない
②そもそもコラージュの定義が不確か
の二点から「絶対にコラージュじゃない」という断言もしにくいよなと私は思っています。

まず①についてです。
絶対しないかというと分からないのではないでしょうか。アーティストのサインっぽいものを出力しちゃっていたりするみたいですし、どういうことはダメ、という部分はAIに上手く教えられていないし難しい課題かと思われます。

直感的に、イラストAIが学習して保持している特徴って人間で例えるのなら記憶のようなものではないでしょうか。

人間が例えば小説を書いていて、「他の人が書いた小説の一部が綺麗にハマりそうだったから覚えていた文章を丸々書き写す」というのは良くないことですよね。
人は脳から直接絵をアウトプットすることはできませんが、コンピュータにとっての画像とは結局のところ文字列です。
「学習データが（部分的にでも）保持されていて出てきてしまうことは絶対にない」と断言できるだけの根拠も私が少し探した範囲では見つけられませんでした。

また、小説の例えで人間の場合ですと、文章が丸々同じというわけではなくても、例えばハリーポッターとなるべく同じ話を記憶で書いて、自作の小説として発表するというようなことはアウトです。

次に②のコラージュの定義についてです。
推進派には怒られそうですが(笑)、イラストAIをめちゃめちゃ簡略化すると下の図のようになります。

これが例えば数枚の画像をランダムに切り貼りして出力するというような単純な処理を行うプログラムであれば、誰が見ても
「それ作品って言って発表するのはナシだよ…コラージュでしょ」
になるでしょう。

では、元となる画像の枚数をすごく増やしたらコラージュではなくなるのでしょうか？
処理を複雑なものにすればコラージュではなくなるのでしょうか？
それとも、元となる画像の枚数を増やしてかつ処理を複雑にすればコラージュではなくなるのでしょうか？
コラージュと非コラージュの境界はどこなのでしょうか？
学習データをなんらかのパラメータに変換すればOKなのでしょうか？

AIイラストをコラージュと呼ぶか呼ばないか、コラージュの定義の部分がまず人によってまちまちで、そこでも議論がとっ散らかっているように見えます。

「要素を組み合わせただけだからこんなものはコラージュだよ」なのか「シンプルに継ぎはぎした出力を返すだけではないからこれはコラージュではない」なのか。

個人的にはAIのイラストは複雑なコラージュに近いのではないかな…とは思っています。
学習データから抽出した特徴を学習データのコラージュのような形で保持していて、特徴同士をコラージュ的に組み合わせて画像を作っているように見えるので。

ただ、コラージュのようなものだと思うからと言って、別に全面禁止されるべきだとも思ってはいないです。

ところで、先ほどの図に顔を描き足してみたところ、急にクリエイティブっぽさが出て不思議だなって思いました。良いんじゃない？っていう気がしてきませんか？
学習というワードも効いているのかもしれません。

そもそも機械学習の学習やlearningという言葉自体が動物の動作を表す言葉である”学習”の流用なわけで、無意識に擬人化(擬生き物化？)と感情移入が行われ、心証が引っ張られているかもしれない気がしてきました。

例えば「学習」、「学習データ」ではなくて「パラメータチューニング」「パラメータチューニング用データ」というような言葉が使われていたらまた印象は変わるのでしょうか？

-人とAIの学習は同じなのか

では人とAIの学習の違いについて考えていきます。

「人間が絵を見て学習するのと機械学習は同じだからAIだって良いはず」という意見を散見します。
まず、NNは神経細胞の挙動を真似たモデルな訳ですがNNと神経細胞の学習の挙動が本当に同じかどうかは今の人類はまだ誰も知らないのではないでしょうか。その辺りははっきり言ってほんとに謎です。
というかそもそも、「NNで絵を描かせたり音楽を作ったりしてみるぜ！」っていう試みって、人間ができる課題ができるようになるのか、こういったモデルが人間の脳に近いのかどうかが知りたくて始めた部分あるのではないでしょうか。(私の認識が正しければ)

とりあえず
・神経細胞は出力がステップ関数のパーセプトロンっぽい挙動であるがNNは連続なシグモイド関数なはず
・チョムスキーの生成文法のそれっぽさとか領域ごとに機能が割り振られてるのとか、明らかに脳にはある程度の共通したソフトウェア的な情報が元々入っている
といった部分は相違点です。

NNや深層学習は現在の知見の範囲だけでも完全に脳の挙動をシミュレートしているわけではありません。しかし違いがあるからといってそれが即ち「人間の学習と機械の学習は違う」と言い切れる根拠になるのかも分かりません。

そもそも人の学習や記憶や意識といったものが本当に神経細胞のネットワークだけで成り立っているかも分かりません。なんか実はネット上に神経科学のすごい人が混じって議論してるのなら教えて欲しい。

また、絵を多少練習したことのある身としては学習の質に相違点はたくさんあると思います。
AIの学習と人間の学習でまず大きく違う所は、人間が絵の学習をすると言う時は絵の描き方を学習している点です。
他人の絵を見て学ぼうとした場合、逆コンパイル的な手順を踏んで、時には色々実験してみてからどんな描き方をしているのか推定して学習がなされていると思います。
対してAIでは学習しているものは「絵の描き方の手順」ではありません。

企業秘密的な逆コンパイルが難しいような、どのような手順で書かれたのかよく分からない絵があったとします。
（例えばこれは有名ですが水彩画であれば乾く前の絵の具の上に食塩を落とすというテクニックがあります。知らなければ筆だけで再現できないでしょう。デジタルでも独自のフィルターの重ね方や素材、画像変換などがあれば真似は難しいです）
その絵から絵の描き方を学びたいと思った時、人間であれば手順を再現する必要があり、分からなければ似た絵を描くことは困難です。しかし、AIであれば手順は解明しないまま学習が可能です。

また、他にもある程度客観的に質が違うと思われる点が思いつく範囲で3つあります。

①読み込みの精度が違う
まず、人間の目と脳の画像の読み込み方はすごくいい加減です。さらに、注目しているものが大きく感じられる、盲点の位置のものは勝手に補間されている、など脳によって色々補正されていたり、瞳孔が開けばものは明るく見えたり、ハードウェアにしろソフトウェアにしろそんなに正確ではありません。見ている画に対して受け取り手のバイアスがかかっています。
画像データを処理するという場合デジタルデータであればそのものをインプットできるので、描いた人にとってはより拒否感が強くなるのかもしれません。

②人間が絵を描くときの視覚的な学習データは他人の作品だけではない
絵を描くための脳にとってはおそらく”人が描いた絵に限らず視覚で認識したもの全て”が学習データです。人が描いた絵をどんなに真似ようとしていても学習元の大部分は誰の著作物でもない視覚情報かと思います。
もちろん誰の作品も参考にしないで絵を描くというのは文明社会から離れてオオカミにでも育てられない限り無理そうですが、描いた絵の材料の大部分は誰のものでもない情報で、そこに少し影響を受けた絵という材料が混ざっているのではないでしょうか。
対して画像を出力するAIの材料は基本的に全てが誰かの作品です。

③AIには与えられている副次的なデータが少ない
人の作風にあまりにも似ている絵を描いちゃうのはマナー的に良くないよ、とか、人の絵を部分的に切り取って貼るのは基本ダメだよ、とか、人のサインは自分の絵には描かないよ、とか、指は基本的に5本だよ、とか、そういう人間なら常識的に知っていることを教えてもらってはいないでしょう。”教える”というのも一筋縄ではいかなさそうですが。

絵描きについてのざっくりとした説明と所感

次に、絵を描く人の受け止め方や立場について書いていきます。もちろん一枚岩ではないですし人それぞれですが。

-まず（普通は多分）学習データに使われたくはない

「自分絵を無断で学習に利用されること自体が嫌」がおそらく絵を描かない人にはあまり想像されていないのではないかなと思います。後述もしますが、「絵を学習に利用すること」自体には違法性はありません。
違法ではないのでより分かりにくいのかもなとも思います。

”拾って”くることができるような画像が学習データとして集められているのでしょうが、インターネット上に”落ちている”画像にも多くの場合権利を持っている人がいて改変OKのフリー素材というわけではありません。

無料で見られる場所にアップロードされてる絵は、無償風に見えるのかもしれないですが、（基本的に）権利を捨てているつもりで置かれているわけではないです。

無料で絵を公開するメリットは色々あるのですが、公開することが営業になる、他人の目で見てもらってスキルを高めたい、著作者の許す範囲で見た人に楽しんでもらいたい、などが挙げられます。

とりあえずビジネス的な話だけをしても、絵を公開しておくことは実はけっこう営業効果があるのです。
画像の作者が見つけられてコンタクトが取れる状態であれば、「この絵のようなこういう絵を描いて欲しい」とか「この絵を使用したい」とかアナログであれば「原画を売って欲しい」というようなクライアントと繋がることができます。

そして、絵の作者には著作権というものがあります。
著作権侵害は親告罪ですし、ほとんどの場合では権利者はアクションを起こしていないでしょう。

私も自分の絵が無断で使われてしまっている所を見つけたことは何回かありますが、どれも悪質ではなかったので法的な手段を取ったことはありません。本当に知識と悪気がない絵を気にいってくれた相手だと流石に気の毒なので。でも興味があるので機会があれば一度やってみたいです。
また、例えばゲームのプレイ画面をユーザーが投稿するようなことも実は著作権侵害です。が、権利元が訴えない限りでは犯罪ではありません。ガイドラインを設けていたりゲーム内の機能としてシェアできる場合は、むしろ投稿を止める気はなく宣伝をしてもらおうとか楽しんでもらおうという意図があるかと思います。

話が逸れましたが、しょっちゅう行使する権利ではないとしても、悪質なケースに対しては一応そういう手段も取れる、法に守られているという認識の上で作品はアップロードされています。

「AIの学習に勝手に作品を使われて、出力物もどう扱われるかは分からなくて、法的に訴える事もできないっぽい」という今の状況は多くのクリエイターにとって想定外かと思われます。

今までも知財のモラルは良いわけではなく、作品の発表にはリスクはありました。しかし、リスクに対して対応が取れることが分かっていて、メリットが上回ると判断されていたからこそ、発表がなされていたはずです。

「AIに学習されてしまう」というのは後から出現した（今の法律では）対応が困難なリスクなわけです。
本当にただ学習するだけなら良いのですが、今の出力物の扱われ方を見ると絵を描く側の利益に対する配慮には信頼はできないです。
よくよく考えてみれば世間にこの辺りのモラルは全く期待しない方が理性的なくらいですが。

ところで絵の世界にもオープンソース的なカルチャーはあります。「パターンを作ったから自由に使っていいよ」とか「描きやすいように調整したブラシを配布するよ」といったパーツを配布するようなものが多いです。
そういったものは使用範囲や再配布の可否も含め明示されており、特に記載のないイラストは基本的にそれとは別です。

また、感覚的な部分の話をすると、学習データへの利用とかよく嫌われている謂わゆるトレパクって剽窃のような嫌悪感があるのではないかなと思います。
「この論文読みやすかったな。構成をちょっと参考にしてみよう」と「この論文読みやすかったな。文章をコピペしてこっそり使おう」は大違いで後者だと大問題なわけですが、「AIにイラストを無断で学習させて出力できた作品を発表しよう」は後者寄りな拒否感を持たれているように思います。

-（ついでに）絵を描く目線で見るとAIのイラストはよりコラージュ的かもしれない

引用はしないですが、AIが生成したものに光源が変なイラストがありました。人物の上半身は逆光（後ろから光が当たる状態）になっているのに下半身は順光（手前から光が当たる状態）になってしまっていました。
光源というのは光がどこから当たっているのかの源泉のことで、絵を描く大体の人は設定してどこが影になるのか、どこが明るくなるのかを考えて塗っています。（あえて嘘をつくような描画もありますし、そこまで厳密なものではないですが）

人間で他の部分があれくらい描ける人であれば絶対やらないですし、上半身は逆光の絵から、下半身は順光の絵から特徴を組み合わせて作ったんだろうなというのが見えてしまってややなんだかなという気分です。

絵の描き方を勉強する前は私も光源など気にしていなかったような気がするので、絵を特に描かない人との温度差は見え方にもあるのかなと思いました。私より絵が上手い人にはきっともっとコラージュ的な部分が色々見えているのかもしれないです。

また、絵を描く過程が人とAIでは違いすぎるのも「コラージュ」と絵を描く人が言いがちな原因になっているかと思います。学習の質の項で触れたところとも被る話ですが。

今適当に描いたりんごの絵。
ありがち（かと思われる）なデジタル絵の進め方で作成しましたが、方法は人によって違います。

デジタルで作成される絵は大抵レイヤーと呼ばれる複数枚の画像を積み重ねて制作されています。この例だと９枚の画像を組み合わせていき、最終的な各ピクセルの色が決まります。
レイヤーを一枚しか使わない絵でもアナログでも、人が描くときは手順を積み重ねていって最終的な出力が決まっているということは共通しています。

しかし、AIが絵を作成する場合では人と同様の重ねていく手順は行わず、誰かが重ねて作った色や色の連なりの特徴を出力しているはずです。

絵を作成する手順を知っていると、AIイラストはよりコラージュ的に感じられる傾向があるのかなと思います。

-技術の受け取られ方

絵の仕事を減らしそうな技術の発達はAI以外にも直近でもいろいろとあります。

例えば
・3Dモデルの活用
・画質が良くなってドット絵の需要がなくなった(これはスマホでまた需要出たとか)
・写真をイラスト風に加工
など。

これらと画像を生成するAIの拒否感の大きさの違いは
・倫理的な抵抗感
・法的な不透明さと活用しにくさ
かと思います。

自分で撮った写真を絵に馴染むように加工して背景にする、とか自分で3Dモデルを作ってから絵に利用する、という技術の活用は普通に行われています。

しかし「誰の作品を学習に使われているか分からないモデルで生成した画像を使用する」というのはまず感覚的に抵抗があるのではないでしょうか。かなり盗作っぽく感じられます。

また、まだ法的にも不透明な部分が多いので、ある程度の危機管理意識があるイラストレーターさんやデザイナーさんは積極的な活用に手を出し辛いかと思います。
というかもし友人が印刷物などに使おうとしていたら私だったら止めておきます。AIのイラストが気に食わないから、とか以上に法的にどんなリスクがあるかまだ分からないからです。

倫理観と法的な不安は繋がっている部分もあり、
　今までの感覚的に盗作っぽくて悪いことっぽい感じがする
　→著作権的に大丈夫なのか心配になる
　→判例無いしよく分からない
という活用してしまおうにもなんとも受け入れ難い存在になってしまっているのです。

後述しますが、法的にAIのイラストの活用が完全にクリーンかというと現行法でも断言はしにくいです。また、過渡期で法整備が進んでいないだけに見えるので、AIが作った絵の利用が今後はっきりと著作権侵害となるケースが出てくるかもしれないリスクもあります。

例えば三次元のモデルを二次元化して使う技術を背景に使おう！という話でも、背景を描く人の作業は減ってしまいますが、ここまでの「いいのかな？これ？」は無いのではないでしょうか。

-クリーンなイラストAIを作るとすると

一方、学習データも全て著作者に許可を取っていてクリーンなAIがあったら、上記のような理由での拒否反応は無いはずですし面白そうだなとは思います。

では、学習データの全てにきちんとした対価を払って雑誌の表紙のような綺麗なイラストを生成するAIを学習させると仮定してみます。

上記のサイトを参考にすると、Eランクの雑誌の表紙は15万円〜となっています(参考値の最低ですし、上手い人が書くのであれば全然もっとかかるかと思います)。また、再利用の範囲などによって価格は変わります。すごく安めに見積もって、一枚あたりの対価を20万円としましょう。

絵の値段って馴染みがない人が見ると意外と高い！となりがちですが、綺麗な絵には時間がかかるし打ち合わせなども重ねて作業が進められるので、時給換算するとそんなに儲かるものでもないです。

次に、学習にどれくらいのデータ数が必要かです。何枚の学習データから作られているのかが見つけられたので、BaiduのERINE-ViLGの記事を参考にします。

こちらの記事によると1億4500万件のデータを使用しているそうです。とりあえず少な目に見積もってクリーンAI君には5000万枚のイラストを与えるとことにします。

価格と枚数をこのように見積もると、イラストを依頼して集めた場合
200000×5×10^7=10^13
つまり10兆円が必要となります。日本の国家予算の10分の一くらいですね。安めに推定してもウォーレンバフェット氏が全資産をはたくレベルです。
これならみんな歓迎かもしれないです。

正直、まともな対価を支払ってのある程度クオリティが高いイラスト全体を学習するというのは不可能かと思います。
それだけ絵を描く人や絵を発注する人の払ったコストにタダ乗りしているように見えるのも心象が悪い要因かと思います。

ディープ系の技術を絵を描く人のサポートという形で使うのであれば、自動彩色や塗り分け、パースの狂いを直そう、といったような、絵を描く上での一部分の工程が現実的だと思います。作業感の強い工程を自動化するのであれば協力したいクリエイターも多いでしょうし、実現可能ではないかなと思います。

-絵というものの価値

実は、（個人的には）絵の仕事については長期的に考えるとそこまで心配してないです。
絵の価値とは何で決まるのでしょうか？
私は最終的には希少性と描くのにかかる手間に収束しているのではないかなと思います。

そもそも身も蓋もないかもしれない話をすると、絵というものは生きていく上で必要なものではありません。

では、何が絵に対して対価を払う原因となっているのでしょうか？
私は人の心をいかに動かすか、なのではないかなと思っています。

では、人の心はどういう時に動くのでしょうか？
動く要因については確信は持てないですが、希少価値がなくなってしまったものに対しては動きにくいのは確かだと思います。

今、スマホで人をぱしゃっとと撮れば、18世紀の肖像画家が頑張って正確に描こうとした肖像画よりもずっと正確な肖像が得られます。しかし、写真家でもない人がスマホで一枚写真を撮ることに肖像画並みの対価を払う人はいません。
そして写真の登場後、印象派のような新しい価値観が生まれました。写真の登場前には価値を感じられてはいなかったであろう部分にフォーカスを当てています。

近いことが3Dモデルの技術でも起こっているように思います。
「人が描いた歪みが程よくある絵が良い」とか「三次元では破綻するような二次元の形状が良い」とかという正直よく分からないような（分かるような）言説を絵を描く人の間でよく聞きます。

そしてもっとよく分からないことに、ユーザーもどうもこの価値観を持っています。

「3Dではない、人が手間をかけて描いた絵っぽいものが嬉しい」という基準ができているのではないかなと思います。

モデルを作るもの大変ですが、一度作れば360度どこからでも、上からでも下からでもどこから光が当たっていても、近くても遠くても良い無数の二次元の絵を取り出すことができます。
しかし、無数にイラストがあるのと同じ程の喜ばれ方は無いように思われます。

手間のかかり方とそこからくる希少性が
　　すごくたくさんのイラスト＞3Dモデル一つ
なので喜ばれ方も
　　すごくたくさんのイラスト＞3Dモデル一つ
となっているのではないかと思っています。

人が時間をかけて制作しなければならないモノは、供給の量に限界があるため希少で喜ばれる側面があるのだと思います。
イラストをAIが描けるようになれば、きっとAIが描きにくいような人の絵がそのうち現れて、それが価値を見出されるようになるのではないでしょうか。

例えば原画のあるアナログの絵の人気が今後高まったりするのでは無いかなと思っています。
（実は私はアナログの絵の方がどちらかというと好きなためAIイラストに対して余裕をぶっこいている部分があります。専業ではないのもありますが。みんな画材買おうよ〜！！）
また、ライブドローイングも人気になるかもしれません。

逆にAIが描けるようになってしまった「神絵」と呼ばれるような絵の価値はどんどん落ちてしまうでしょうし、これはもう止められないのではないかと危惧しています。（今の所画角や光源など商業的に必要な条件をAIは指定できなさそうですが、データセットに入れられてしまっている以上時間の問題ではと思っています）

実は（？）大衆向けの絵の人気は元々流行りの移り変わりが激しく、価値はかなり変わるものです。例えば90年代の漫画の絵、というと今から見るとかなり特徴的です。
今回の事件はきっとこのサイクルを一時的にすごく早めるでしょう。今の価値観ですごく素敵な絵を描ける人や、最近そういった絵を発注した人にとっては災難でしか無いと思います。

人間は、量産できるようになってしまうと同じ画像で同じ幸福が得られなくなる、というポイントが「楽しい人が多いからAIイラストどんどんやればいいんじゃないかな」派から見落とされがちなのではないかなと思います。
実用物ではない絵というものの価値って心にどう影響を与えるかしかないのですが、簡単に手に入ってしまうものに心は動きにくいので。

それから最終的には「人間が描いている」という価値は確実に残ります。
「電子ピアノがあればいくらでも正確な音は出せるから音程を正確に歌える人に価値はない」とはなっていないですし、「車の方が速いから世界一足が速い人に意味はない」ともなっていません。

法律関係

-現行法

機械学習の学習データに人が権利を持っている絵を使うこと自体ははっきりと合法です。

著作権法第三十条の四の二で、情報解析に利用できることが明記されています。

第三十条の四　著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一　著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二　情報解析（多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。）の用に供する場合
三　前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用（プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。）に供する場合

著作権法 | e-Gov 法令検索
https://elaws.e-gov.go.jp/document?lawid=345AC0000000048

絵描きには残念なお話なのですが、「AIの学習データへの利用を禁止します」と述べることは何の法的な効力もないはずです。そもそも何千万枚も画像を集めていってる中では読まれもしないと思います。

しかし、出力物の使用など全てが完全に合法であるとも言い切れないのではないかなと疑問に思ってもいます。
先ほどの条文には"著作権者の利益を不当に害することとなる場合は、この限りでない。"という但し書きのような文言があります。

機会損失という観点では利益を害するしかないように思えます。どの範囲でこれが適用されるのでしょうか。

また、個別に出力した画像が著作権侵害になるケースもあるでしょう。

ところで、ただ学習すること自体に違法性がないのは私も妥当だと思っています。

もともと著作物の利用は私的使用（個人的な限られた範囲の使用）であれば無断でも違法ではありません。
誰かがSNSにアップロードしていた猫の写真が可愛かったのでダウンロードしてローカルに保存して眺める、というようなことは違法ではありません。(それを再度アップロードしてしまうのはダメです)

画像をダウンロードしてサーバー内で学習に利用するというのはこの私的な利用に毛色が近いのではないかなと個人的には解釈しています。

-今後の法整備がどうなるか

そもそもアート作品への著作権は、あった方が功利主義的に世の中の人の幸福が増えるので存在しているのだと思っています。

著作権など無くて人が作った作品を自由に利用し放題だと、作品を作った人は不幸ですがそれ以外の多くの人たちには利益があるので、一見そちらの方が良いようにも見えます。

先日こちらの映画を観ました。オススメです〜！
この映画で扱われているメリエスはチャップリンなどよりも古い、最初期の映画監督です。
この頃には著作権というものはあったはずですが、きちんとした保護がなされていませんでした。メリエスは世界的にヒットする映画を撮ったにも関わらず、作品のフィルムを盗まれて上映されてしまうことで受け取れるはずだった対価を受け取れず、裕福とは言えない暮らしをしていました。
彼は映画を撮るのを辞めてしまい作品のネガを燃やしてしまったため、後世に再評価されても残っている作品の数が少ないという状態です。

メリエスの場合は時代に残されたというような面もあり、著作物の保護だけの問題ではないですが、適切な対価が得られていればもっと作品の制作に投資をすることもできましたし捨て鉢になることもなかったのではないかと思います。
彼の作品が好きだった人もそちらの方が良かったはずです。

良いものを作る人を適切に保護することは、作品を作る人、その作者の作品が好きな人の双方にメリットがあります。作品を盗んで利益を得ていた人だけは別かもしれませんが。いや、盗むにしても制作がなされなくなることを考えると良くない例えでの焼畑のようなものでしょう。

イラストAIからの絵を描いた人の権利を保護をするのとしないので、功利的にどちらが良いのかは議論すべき点かと思います。イラストAIも全面的に禁止はせずに、適切に著作者の保護もする所にベストな落とし所があるのではないかなと思っています。

現状は単に議論や法整備が進みきってはいないせいで不確かな面が多いように思えます。流石に無法地帯すぎるので、今後判例ができたり法改正もあるのではないかなと個人的には思っています。

ところで日本の法律は技術を推進したいためか、かなり機械学習に甘いのですが、国外の法律がどのようになっていくかも分かりません。

日本も加盟しているベルヌ条約に加盟している国では、他国で作られた著作物の権利を保護する必要があります。~~私の解釈が正しければ、著作権の法律は作品が作られた国に基づいていたはずです。~~

もし日本で「アーティストの権利より機械学習技術の発展を優先させるぜ！」という法整備が進んでいったとしても、よりアーティストの権利を守れる法律のある国の人から訴訟される可能性も出てくるのではないかと思います。
(2023/7/14 追記)おそらく解釈が正しくないです。こちらは本国法説的な解釈なのですが、侵害行為の行われた地の法を準拠法とする保護国法説が一般的には採用されていることが多いようです。
ご指摘をいただきました。
https://twitter.com/shujisado/status/1679756481514868737?s=46&t=SA42-5ge_R9DuUBsuZbCTw

インターネットで何千万枚も集めた画像など、どこの国の人に権利があるのか誰にも分かりません。

総括して

-絵を描く側が取りうる行動と感情論

もし今後も
・感情的にめっちゃ不快だし不利益だけど作品が機械学習に勝手に利用される
・法律で保護されない
という状況が続いた場合、絵を描く人や絵の権利を持っている人にできることは何でしょうか？

まず軽くできることは絵を有料公開にして簡単には取られにくくすることです。価格は高くすれば高くするだけ流出のリスクは抑えられるでしょう。
一番確実なのはインターネットに公開している作品を全て削除し、転載を見つけたらドンドン訴えることです。

感情論というものはバカにされがちですが、このイラストを生成するAIというケースだと絵の描き手は単なる「感情論で技術の発展を邪魔してくる集団」というわけではない関わりを持っています。coinhibe事件の神奈川県警の立場とは異なります。
今のところ特に日本では技術者側の権利が強めになっていますが、絵の描き手には絵を公開しない自由も絵を描かない自由もあります。感情として本当に嫌であれば学習データとして使わせないことも可能です。

私はかなり人の力を楽観視しているので、写真が発明されても印象派絵画が生まれたように、AIが作れない魅力的な新しい表現を生み出すすごい人はいるだろうと思っています。
しかし現在のように学習に使われることに描き手には何もメリットやリターンがなく、（まだAIのイラストには課題があるため今の所はすぐに起きることではないと思っていますが）仕事を奪われるリスクまで生じれば、特にスキルが高かったり魅力のある絵を描けたり、既に仕事の伝手のある人は作品をパブリックに公開しなくなっていってしまうのではないでしょうか？

フランダースの犬は19世紀が舞台の作品ですが、主人公のネロはルーベンスの絵を見るための高い鑑賞料が払えませんでした。デジタルアートに関してもそんな感じになる時代が来るかもしれません。（それもそれで絵を描く人の地位が上がりそうですね）

ピーテル・パウル・ルーベンス（1611-1612）「埋葬」
ルーベンスは昔の人なので今ではパブリックドメインで作品が利用できます。ありがたいですね！

-機械学習ユートピアのディストピア

新しいデータが入って来なくなった世の中について考えます。今まで学習したデータからAIはイラストや絵画の画像を作り続けることができるでしょう。
一見魅力的です。しかし、絵のスタイルには流行があるしすぐにイケてる・今っぽいものが変わってしまうのです。「絵柄が古い」という恐怖の言葉があるくらいです。

デフォルメされたものはもちろん、写実的に描かれた絵でさえ時代や場所によって特徴があります。

西暦0年から2000年の全ての地域の全ての絵を集めたとしても、アニメが好きな人が見て「最近日本で作られたアニメかな？」と認識されるような絵はどれくらいあるでしょうか？または、「未来っぽくてかっこいい。SF映画のコンセプトアートかな？いつ公開だろう」と今思わせるような絵はどれくらいあるでしょうか？
2000年までの絵を学習してそういったイケてる絵を安定して生成することは難しいでしょう。

しかもこの流れは色々なパラメーターが絡み合っているようで予測は困難です。
例えばアートの文脈で有名な話なのですが、「景気がいい時には抽象画が流行り、景気が悪い時には写実的な絵画が好まれる」というのがあります。
景気が予測できるようになったら絵など作らないでそちらでいくらでも儲けられるでしょう。

こちらもパブリックドメイン。
知っている限りだと日本の少女漫画的な目が大きい様式に一番近いのってシュメールの美術だと思う。

多分こういう記事を日本語で読む人は大体美少女とか美女のイラストが好きだろうと思うので(偏見)、そういう感じで想像していただければ良いのですが、新しい学習データの供給が無ければイラストはすぐにタダで手に入る！ただし全部浮世絵みたいな状況にいずれ陥ります。
（浮世絵をディスる意図はないです。念の為。美意識もデフォルメの方法もファッションも今とは違うものの例えとして出しています）
しかも浮世絵以外の絵は、学習データへ利用されるのを避けるため、簡単には見ることができなくなっています。しかも絵を描く人の総数が減ると全体的に下手になっているかもです。

「○○先生の斬新な方法でデフォルメした猫がほんとに可愛いらしくて」とか「△△先生の描く女性の絵がすっごくセクシーらしくて」とかといった伝聞を頼りに美術館に行く。
撮影は厳禁で画集やポストカードなんていう前時代のものは勿論売っていないから目に焼き付けなければいけない。
画材メーカーが開発したコピーガードメディウムは優秀だから、隠し撮りしてもまともな絵は写らないだろう。

ゲームのイラストが入ったスクショをネットに転載などしてしまえば大事だ。隣の学科の奴がそれでゲーム会社に百万払ったらしい。
そんなバカをやるくらいなら好きなキャラクターのガチャに全力で課金した方がいい。誰が見ても当然で理性的なことだ。だって絵が見られるのだから。

身の回りの出版物とモニターの中にはいつも、古臭い2030's風の浮世絵だけがあった。

…みたいな未来もそれはそれで面白そうですが。

-結論　この先どうしていくのが良いか

まず、ことイラストAIに関しては技術者・利用者と学習データとなる絵を描く人は共存していかなければならない、と思います。

絵を描く人に全力で逃げられてしまい、新しい学習ができなければAIが出せるイラストはどんどん古くなり喜ばれなくなります。せっかく計算資源を費やして作ったモデルも手法も「良いと思われる絵を作るAI」においては意味がなくなってしまいます。

絵を描く人の視点に立つと…AIと共存する必要別にないのですよね…。もしかして漫画を描く人でお話を進めたい人とかなら欲しいかも……？
納得できるだけの利益還元の仕組みができたら良いですよね。

今のところ「違法じゃない！」(学習はという部分は確かですが、利用には個々のケースでの判断があるはずです)とか「人が学ぶのと同じ！」とかといった主張でAIイラストを全肯定するのは不誠実か不理解なように思えます。
結局は学習データに依存した技術なので、共存できるような譲歩があるのが倫理的にも技術が生み出す利益の観点においても良いかと思います。

現実的な落とし所としては、
・AIのイラストには簡単には取れないような透かしを入れる
・出力物は個人使用の範囲でのみ使えるようにする
あたりでしょうか。

人の絵と完全に住み分けさえできていれば絵描きへのデメリットは少ないですし、楽しい技術ではあります。
イラストAIだけのコンペなどが今後あったら良いのではないかなと思います。

その他見かけた意見に対して思うこと

-写真の発明と同じように技術の進歩だし仕方ないんじゃない？

今話題になるようなAIは大量の画像データが必要で、イラストを学習する場合著作者に権利がある作品を使ってしまっていることは少し特殊な事情なのではないかと感じています。
「写真があるから肖像画家は全員いなくなってもいい」と同じレベルでは「AIがあるから絵描きは全員いなくなってもいい」は成り立たないので共存を図る必要があると思います。

-写真が発明されても写実絵画は生き残ってるし大丈夫じゃない？

いっぱい死んでる！！今活動してる人からすれば大丈夫ではないですね！

-AIが描いたイラストをAIが学習すればいいのでは

最初にAIが描いたイラストは人が描いたイラストで学習しているわけで、それって処理を増やしただけになってしまわないでしょうか…？

-改正著作権法で学習は合法だから合法

学習までは私も何も問題ないと思っています。著作物の使用も元々個人利用であれば法的に問題ないわけで、著作者サイドからはそれと似ているかと思います。
しかし出力の利用は学習とはまた別ではないでしょうか。

-絵描きが既得権を主張している

知的財産権を既得権だと思う発想が自分にはなかったので新鮮でびっくりしました。既に得ている権利だからそうなのか…？

-叩かれまくってAIがかわいそう。。

こういう発想優しくて好きです〜！人間にも心の綺麗な個体っているんだなみたいな感慨を覚えます。
こういうAIってドラ○もんやア○ムのような自然言語を解して人格がある汎用的な物ではなくて、特定用途の課題をこなすプログラムなのでご安心下さい。
いや、電卓にも意識は宿るのかもしれないみたいな哲学みたいな話になってくると謎ですが。

-AIで作った画像をイラスト投稿サイトが禁止するのは差別的では

まず思ったのはサーバーを管理している人のことも考えてあげて。。
現状では絵を描く人間の数も描ける絵の数も限られており、それを想定したサイト運営がなされてるはずです。とりあえずモラルとか権利の話を置いておいてもサーバーに想定外に負荷がかかりかねないので妥当な判断かと思います。

-著作権切れのやつだけ使えば

それは別に何も問題ないと思います！(注: 著作者人格権や他の法、倫理的問題のある画像はもちろん良くないですが)
死後70年だと、それだけ時間が経てば今生きてるアーティストと競合しにくいでしょうし。

-フリー素材だけ使えば

フリー素材も実は色々あって難しいのです。使用できる範囲は素材によって決まっているはずです。フリーで配布しつつ広告収入を得ているものは私もやっていますが、再配布はダメだとか商業利用したい場合は追加料金が必要とか、実は色々な規則があるものが多いです。

-絵柄に著作権はない

絵柄にはなくても作品に対しての権利はあり、作品そのものを学習に使われているのでまた別の議論が必要かなと思っています。

-二次創作とかしてる絵師が文句言ってるのはおかしい

ファンアートにも実は著作権があるので権利主張してOKですよ。
元の作品にも著作権があり、二次的著作物にもまた単独で著作権があるという形になっていたはずです。

-自分の絵だけ学習させて活用すればいいんじゃない？

数千万枚というような大量のデータが必要なので、今の所無理そうですね。。
世界で一番多作な美術家とされているピカソの作品数ですら約15万点です。ありえないくらい多いですが、それでも一生かけて作っても足りないです。

この記事が気に入ったらサポートをしてみませんか？