A・I・イラストは切り貼りなのか?
はじめに
ある人は言う――
「AI生成イラストは切り貼りである」と。
あるいはこう言う――
「コラージュであり」「ミキサーにかけたようなものである」と。
一方、ある人は言う――
「AI生成イラストは切り貼りでない」と。
「コラージュではなく」「人が描くものと同じである」と。
そして何故かどちらの人も、自説を曲げず相手の言い分に耳を傾けない。
そんなやり取りを何度か見ていて、ふと思った。
……いやこれ、どっちも正しいんじゃね?
ということで、両方の立場を踏まえ、なぜそうなるかの理由までの考察記事を書いてみました。
「切り貼りである」「切り貼りでない」両方を肯定的に捉えています。
そのため、下記に該当する方はにはあまりお勧めいたしません。
・どちらか片方でないと、どうしても困る人
冒頭に書いた通り、基本的には両方の立場を肯定的にとらえた記事です。
「両方正しいなんておかしいぜ!真実はいつも一つ!それ以外はすべて欺瞞!」
と結論がついている方にとっては読む価値がありません。
・AIイラストのユーザーが嫌いでそんな奴の文章を読みたくない人
ほかの記事を見てのとおり、AI猫は生成AIユーザーです。
また、(収支としては赤字をガンガン積み重ねる一方ですが)LINEスタンプの販売もしており、この記事の表紙もAIイラストを使っています。
もちろんこの記事の性質上、中立に気を使いますが、そもそもそんな奴の書いた記事は読まねぇ!って方にとっては心身の健康の為にやめましょう。
両論の提示
提示
まずは両論……理由と結論を提示します。
今まで見たことのある意見について、脚色や補足やらしたものです。元となるような書き込みを貼ると個人攻撃みたいになるので、控えておきますが。
またこの提示に対して、どちらの意見であれ、すぐに頭に反論が浮かぶ方もいらっしゃると思いますが、グッと堪え、まずは読んでください。
立場A.AI生成イラストは切り貼りでできている
①生成されたイラストは、いつもどこかで見たものの組み合わせである。これは読み込ませた画像の切り貼りであることを示している。
②生成されたイラストを実際に見ると、全体と細部のバランスが取れていない、あるいは同じ絵であるのに部分によって理解度が著しく異なるなど、一人の人間が描いた絵と比べ非常にアンバランスである。統一感がなく多数の人間が描いたものをツギハギした、すなわち切り貼りのようなものである。
③生成されたイラストでは人体が崩壊することが非常に多い。これは人体の構造を理解せず切り貼りしているから起こる現象であり、人間のように学習したのではこうはならない。
立場B.AI生成イラストは切り貼りではない
①イラスト生成AIは、CLIPを用いてイラストとテキストをベクトル化し多次元空間にマッピングし、また元の画像にノイズを付加・除去することでデータの再構築を学習し、拡散モデルがランダムノイズからプロンプトに応じたイラスト生成するものであって方式として切り貼りではない。あーー 何言ってるかわかんねぇよ
②切り貼りであれば元の画像があるはずだが、ごく限られた一部を除いて元の画像が提示されることがないので切り貼りではない。マスピ顔と一致する絵を学習元から持ってきてみろ。
③モデルサイズを見ればわかる通り、モデルは内部に学習元データを持っていないため、原理的に切り貼りなどできない。
さて、どっちが正しいのか
といったものの……
ほとんどの人……特にどちらの立場でもない人は、すぐ気づくと思うんですよね。立場Aも立場Bも、全く別の話をしていることに。
●立場Aが言う「切り貼り」は「既存要素の組み合わせの実質的な切り貼り」
であり、また主に生成物に関して述べている。
●立場Bが言う「切り貼り」は「既存画像の組み合わせの古典的な切り貼り」
であり、また主に仕組みについて述べている。
と読めば、どちらも正しいことを言っているとみても矛盾なく成立し、そもそも対立が発生していない。
であるならば。
立場Aも、立場Bも、相手が言っている意味が理解できていなかっただけであって、切り貼りの概念さえ共有すればお互いの意見が一致するだろうか。
立場A「実質的に切り貼りに見えるけど、元の画像をそのまま使用しておらず古典的な切り貼りと全く違うことは認めよう」
立場B「古典的な切り貼りではないが、君の言う通り実質的な切り貼りと言われてみればその通りだ」
詩人「つまり切り貼りであるともいえるし……切り貼りでないともいえるね」
しかし残念ながら、きっとそうはならない。
例えば下記のような反論がさらに行われることになる。
(それぞれ下記④は実際に見た意見ですが、⑤は創作度合いが高いです)
立場A.AI生成イラストは切り貼りでできている(反論)
④生成されたイラストでは、学習元にあったであろう、例えばロゴやサインがそのまま出現することがある。これが切り貼りの証拠である。
⑤すべてではないにしても部分的に古典的な切り貼りも行われている以上、切り貼りツールである事実は動かない。
立場B.AI生成イラストは切り貼りではない(反論)
④AI生成でしていることは「概念の」切り貼りと言えるかもしれないが、それは人間の創作と同じであり、それを批判することは創作の否定である。
⑤切り貼りに見えるというのは、客観的な事実ではない。同じイラストでも切り貼りに見える人と見えない人がいる、主観的な判断である。それあなたの感想ですよね? なんかデータとかあるんすか?
この4点も結局のところ、ある意味では正しいし、ある意味では間違っているし、お互い論点というか明らかにしたい点がまだずれているので争いは続きます。ずっと続きます。人類は愚かです。世の中そんなもんです。
結局何が問題なのか
記事の目的に立ち返る
今回の目的は問題の明確化であり、立場Aと立場Bの和解を目的としていませんので、次に進みます。
前段で両方を肯定的に捉えたときに明らかになる問題、つまり「なぜ切り貼りでないものが切り貼りのようであるのか」についてです。
立場Aは言うかもしれません
「切り貼りのようなものを切り貼りでないと言い張るやつらの主張が間違っているからだ」
立場Bは言うかもしれません
「切り貼りでないものを切り貼りのようだと言い張るやつらの主張が間違っているからだ」
ここで、私はいずれの立場も取りません。
切り貼りのようであることも、切り貼りでないことも、いずれも間違っていないという立場をとります。
人間による「切り貼り」作品
ところで。
人間の作った作品でも、「どこかで見たものの寄せ集めで統一感がない」「ただ好きな物を並べただけで筋がない」「既存の切り貼り作品」と評されることがあります。
特に作者自身の人生における経験、あるいは別分野の体験というインプットがほとんどなく(あるいは活用することなく)、同分野の作品のみをインプットとして作られた作品がそう言われがちです。
「小説ばかり読んできた奴が書いた小説」「漫画ばかり読んできた奴が描いた漫画」「ゲームばかりしてきた(以下略)」と揶揄されることすらあります。
もちろん人間が作る以上、同分野の作品「のみ」をインプットするのは、基本的には不可能です。
どうしたってどこかに体験や感情が入り込むし、別分野を全く見ないことはできません。また、等身の低いギャグ漫画しか読んでこなくても、人間の身体を持っている以上、漫画が過度にデフォルメされた表現だと知らないということはありえないでしょう。
現行のイラスト生成AI
しかし、今のイラスト生成AIは人間に不可能なそれをやってのけます。
まさに「画像だけ読み込んで画像を出力する」ものです。
身体もなく、感情もなく、故に体験がありません。空間把握も、時間把握もできません。
画像しか読み込んでいないので、人間の身体がどういう形をしているかわかりません。正しい指の本数も知りません。(何本見えているかは知っているかもしれません)
画像しか読み込んでいないので、投球フォームも知りません。転倒する動作も知りません。泳ぐ動作も知りません。連続した動きという概念がなく、切り取られた場面のみを学習しているからです。
画像しか読み込んでいないので、斬新なアングルで画面を構成することもできません。また、特殊なアングルのイラストにおいて、そこに誇張表現が含まれているか否かを判断することもできません。
仮に人間であっても、努めて意識的に他のイラスト以外からの影響を排除した作品を制作すれば、「画像しか見てこなかったやつが作った画像」「既存の切り貼り作品」と評されるでしょう。
もちろん生成AIは人間が使う道具であるので、出力者や編集者の意識や能力次第では、統一感や作品を通した主張はできないことはないでしょう。しかし、その意識と能力があり、かつわざわざ今の画像しか読み込んでいないイラスト生成AIで作品を作ろうとする人間はごくごく僅かと思われます。労力と結果が釣り合いません。
ということで、巷には切り貼りではないが切り貼りのような作品があふれることになった次第です。
問題解決の方法
では切り貼り感のない出力をするには、イラスト生成AIがどうなれば良いか。
人間と同様、別分野を取り入れ表現の幅を増やすことです。
今も行われている動画学習による時間把握はもちろんのこと、最低でも空間把握は必要です。イラストであればその空間とデフォルメや誇張表現の紐づけも必須です。物理のほか科学的な知識、さまざまな文化に対する理解も必要になります。
運動するのもいいでしょう。実際に筆をとって絵や字を書いてみるのもいいでしょう。いろんな街を訪れ、うまいものを食って、泣いて笑って転んで立ち上がって人生……いやAI生経験を積むべきです。
画像ばかり見てないで幅広く学べ!街に出ろAI野郎!
以上。
参考記事1
「切り貼りである」という感覚が、非常にわかりやすく言語化されていると思った記事
参考記事2(自分の記事)
結局人間との学習範囲の違いじゃね?って話(雑)
この記事が気に入ったらサポートをしてみませんか?