2024-01-08: 画像生成AIツールの実社会普及における現況と課題への考察

2024年1月9日 19:13

はじめに

年始、カードゲームなどの非電源系ゲームで世界的に有名なWizards of the Coast LLC（WotC）が広告画像に画像生成AIを利用したことを認め、ネットを中心として炎上騒動に発展しました。

WotCは上記の事実を認める前に、画像生成AIの利用を否定するステートメントをX上で一時的に公開しており、WotCのユーザーや既存アーティストに対する倫理観、リスペクトが問われる状況に発展しています。

上記が実態として誰の、どのようなモチベーションによって起きたマーケティングなのかについては疑念が残りますが、最終的にWotCがコミュニティに対して主張を訂正したことは、Jason Rainvilleが言うように良いニュースだと私も思います。
なんでもそうですが、誰かがとったアクションに対して、ポジティブなリアクションを意識的にすることも忘れてはいけないと思います。それが成熟したコミュニティの要件でしょう。

This was what I hoped would be the case. So, all in all good news.

I'm going to keep an eye on what the evaluation of their relationship w vendors is going forward. And if those ads are going to be removed or replaced. https://t.co/eWvLn4GvaR
— Jason Rainville (@JasonRainville) January 7, 2024

本騒動を受け、Dave Rapozaのような、長い時間と労力をWotCに捧げ、MtGのコミュニティからリスペクトされていたアーティストがWotCとの決別を表明してしまいました。

WotCからすれば、Daveのような優れたアーティストとの絶縁、消費者コミュニティとの軋轢は望まない展開だったはずです。
表層的な事実を整理すれば、今回、WotCはイラスト・IP作成のコストを生成AI利用によって低く抑えようとして、組織の財産とみなせるアーティストとの関係を劣悪化させてしまいました。

これは、生成AI利用によって利益を得られると踏んだ企業が、逆に大きな代償を支払い、総合的に見ればコミュニティやアーティストも含め、多くの人が不幸になった事例です。

少しメタな余談ですが、本件の推移は典型的なキャンセル・カルチャーのそれであり、過剰な攻撃や特定人物への人格攻撃に発展していないか、という状況そのものに対しての警戒が求められる事態でもあります（どこまでが過剰でないのか、何が理性的なのか？　それは何によって決まるのか？　という別種の難しい問題があることにも、私たちは注意を払うべきです）。
とはいえ、コミュニティやアーティストが「これ、おかしくないか？」という点に声を上げたことは、MtGを巡る状況として間違いなく健康だったと思います。

画像生成AIを取り巻く言論状況下は、しばしば強い語彙や侮蔑的・乱暴・冷笑的な言動が横溢しています。
Xを眺めていて、そんなTLに疲れてしまった人もいるでしょう。

画像生成AIのデータセットに関する直近の問題として、著作権侵害や「学習されない権利」を巡る議論、児童性的虐待画像のようなイリーガルなデータの混入可能性などが挙げられます。
こうした、ダーティな話題に事欠かない点も、画像生成AIの議論が白熱し、時に強い言葉が用いられる一因かと思います。

私の自己紹介

生成AIに関して語るとき、誰がどのような立場で語っているかは、論旨に重要な影響を与えると思います。
思想や既得権益が、議論対象への態度決定について少なからず影響するはずです。
なので、私が何者で、どんな考えを持っているのか簡単に紹介します。

私は2024年現在、Software Engineerとデジタルアーティスト・漫画家を兼業しています。
スタートアップでプレイヤーとして働きながら、商業誌に漫画を連載したり商業イラスト・アニメーションに関連する仕事をしています。

また、大学院では生成AI技術の要素技術であるニューラルネットワークの応用研究を行っていました。修士課程までしか修了していないので、たいした成果や知見はありません。
最新の世界的な機械学習の研究動向については素人です。

客観的に見て、少し珍しいキャリアを歩んでいると思います。

個人的な気質・傾向として、人間の手仕事や、人間の思想、感情など、人間系のアウトプットに高い価値を感じます。
いちおう技術者の端くれですが、楽観的技術至上主義ではなく、技術発展が世の中のあらゆる課題を自然に解決するとは思いません。
社会発展や課題解決は、技術発展だけでなく、それを利用する人間の成長、社会成熟が必要だと考えています。

近視的に、現在の画像生成AI技術に対しては、研究対象として高く評価し一層の発展期待する一方、それを受容する社会側の問題の多さに困惑し、動揺しています。
画像生成AIについては、それを実現する技術情報や研究成果、ジャーナリズムは確認していますが、利用は避けています。

生成AIを取り巻く状況は進展が極めて著しく、キャッチアップもままなりません。
生成AIの社会受容によって自身の個人的な既得権益を侵されたり、「こんな未来になったら嫌だな」という将来への舗装にならないか不安です。これは、多かれ少なかれ、誰しも抱える不安だと思っています。
人間として当然だと思いますし、口に出すと少し自分が幼稚で独善的に感じられてしまいますが、大事な感情だと考えています。

画像生成AIが抱える課題の種別整理

以前投稿したnoteで、MITメディアラボの研究者であるZiv Epsteinの論文を紹介しました。

Epsteinらは、生成AIを巡る問題を以下のように分類しています。

美学と文化の変化（視覚文化の美的多様性や規範への影響）
著作権利の法的側面（著作権者の不公平性、エンドユーザーの有利性など）
創作活動の労働経済学（AIと創造的な創作活動との相互作用、アーティストの雇用問題や視覚文化市場の経済理論など）
メディア・エコシステムに対する影響（AIのアウトプットの真偽や誤った情報の流布など）

上記は生成AI全般が抱える問題の分類ですが、画像生成AIは上記全てに関わりがあります。

議論するとき、私たちは今なにを問題にしているか、どのようなコンテクストを共有しているのかを明確にしなければなりません。
そのために、Epsiteinらが行ったような問題の整理や領域化は有意義です。

不特定多数がコミットメントするサイバースペース、とくにXのようなSNSでは、腰を据えた建設的議論が難しい印象があります。
論点先取や結論ありきのステートメントを異なる論陣から投げつけ合う、雪合戦になりがちです。
声を上げ、意見を表明することは大事ですが、お互いを傷つけ合う雪合戦を演じることは避けたいものです。

上記の4領域は、しかしそれぞれが絡み合い部分的に重複していますし、領域どうしの孔に落ちてしまっている問題もあると思います。

Xで散見される主張について

Xでは、画像生成AIの社会的利用を巡って、肯定・否定双方の意見が入り乱れています。

SNSは十分にコンテクストを共有することが難しく、匿名的な対話相手の背景や人格へリスペクトを持って持続的に対話することに向いていません。
エコーチェンバー効果の影響も受けるため、自分の考え方と親和性の高い意見を高く評価してしまいますし、心理的安全性が低いため（間違ったことを言ったら恥をかくのではないか、罰せられるのではないか）真に自由な対話空間とは言えません。

その結果、議論が空中戦化し、ディスコミュニケーションに至っているリプライの応酬をしばしば目にします。

「生成AIの発展は止まらないのだから適応すべき」

ここ数年における機械学習の躍進は目を見張るものがあります。
Epsteinらは、現状を「目隠しでジェットパック操縦するようなもの」と表現していますが、多くの研究者がこれに同意するでしょう。
研究領域として成長著しいが、その研究が向かう先が予測できない状況です。

ひとたび電池や内燃機関が発明されたとして、この発明を無かったことにはできません。その意味で、生成AI研究は今後も続いていくでしょう。
この研究自体にNOを突きつける人もいると思いますが（たとえば、クローン技術研究のように）、研究自体を人類史から排除したいと考えている人は、そう多くないと感じます。
侮蔑的な意味で用いられてしまっている「反AI」という立場の陣営が実在するとすれば、このような立場が反AIと言えるのではないか。

一方、機械学習の発展と独立に、その社会受容には上記の4領域に代表される様々な課題が山積しています。
2の著作権利のような法的側面だけでなく、倫理規範的な課題もあります。

「法的な問題がクリアできていれば画像生成AIの利用に完全賛成」というクリーンなAIを期待する人もいれば、法的だけでなく倫理規範や美学的問題との折合いを着けずにはAI利用を認められない人もいるでしょう。
これは当然です。人間は多様なので。
かくいう私も後者側の立場です。

2024年現在、「生成AIの発展は止まらないのだから適応すべき」論に対する批判は、既存の画像生成AIが利用しているデータセットの問題に起因するところが大きそうです。

不適切な画像や、肖像権を有する人物・著作者の許可なく収集された画像が混入しているデータセットは、各国の現行法でその部分的・全面的な学習利用が適法かどうかと独立に、多くの人の感情を逆撫でし、不安にしています。
これは、2024年時点の客観的事実として認められるべきだと思いますし、そんな状況に対して「それはしょうがないこと」と状況への恭順を促すことは、生成AIが抱える課題から目を逸らした非建設的な態度だと感じます。

ただ、そのような生存戦略についての批判と独立に、なんとか時代と随伴しようという各人の姿勢そのものは否定されるべきではないと思います。

SNSでは、このような、「Howは支持しないが、Whyは理解できる」といった部分的な共感や弱い否定・肯定などをしづらく、また容易に誤読されコンテクストからドロップするため、シンプルに全面的な肯定か否定が表明されることが多いです。

このステートメントに対する私自身の態度を表明するならば、「生成AIの発展が止まらない点はアグリー。しかしその社会的利用には何段階かのハードルがある。このハードルには強いハードルと弱いハードルとがある」と言えるかもしれません。

ポイントは、機械学習自体の進化と、そのプラグマティックな社会受容を分離する点にあると思います。
素朴な意見ですが、この最低限の前提すら共有されず、お前は反AIか、それとも肯定派か、といった非建設的な応酬をしばしば目にします。

強いハードルと弱いハードル

これは私の独自用語です。

生成AIにおける強いハードルとは、上述したいくつかの法的側面であり、この問題を解決しないことには、画像生成AIからダーティな脅威を排除し得ない問題です。

生成AIにはざっくり3種類の脅威が存在すると思います。

ひとつは、著作権のような知財権、人格権としての肖像権やプライバシー権、人権といった権利に対する侵害という形式のリーガル・技術倫理的な脅威です。
各国で法制度が違いますから、A国では適法だがB国では違法、といった差異はあるかもしれませんが、現在データセットの内容を巡り国際的に最も問題視されている課題はこの点です。

ふたつめは、4領域でいうところの、労働経済学やメディアエコシステムの脅威。
市場の力学によって、既存のイラストレーターや写真家、CGクリエイター、ミュージシャンといった創作行為を生業とするアーティストの雇用問題や、コンテンツがAI生成品かどうかをいかに真偽判定するかといった、経済・社会的な脅威。

みっつめは、そもそもアートとはなにか、イラストとはなにか、音楽とはなにかといった、抽象度の高い哲学的・美学的な価値観に対する脅威です。
「AIの学習と、人間の学習は同一視してよいか？」や、「どこまで作業を自動化すると、AIと人間の主従が逆転するのか」といった問題が対象で、もっとも難しい話であり、根幹的な話です。技術倫理にも関わります。

3つの脅威のうち、最初の脅威が最も大きなハードルです。最後のハードルが最も小さい。ただし、「小さいので簡単なハードル」というわけではないという点に注意してください。
仮に、クリアなデータセットのみを少量学習し、現在のStable Diffusionと同等のアウトプットを出すアルゴリズムが開発されれば、1つ目の脅威は解消されたと言えるでしょう。
この段階で「AI利用のハードルは消えた！　オールクリア！」と考える人もいるでしょうが、私はそうは思いません。

私が個人的に最も悩んでいるハードルは、実は3つ目です。これは、3つ目を社会課題として最重視しているからでなく、3つ目が問題としてもっとも難しいからです。

現実利用においては、この問題は短期中期的には無視できると思いますし、おそらく話題の中心にはならないと思います。
あくまで、議論の中心は今後も当面は、もっとプラグマティックな、法律や企業倫理でしょう。

創作における人間中心主義

今井翔太『生成AIで世界はこう変わる』では、生成AIとアーティストとの今後の関係を、以下のように予想しています。

おそらく今後、従来のクリエイターは、自身の感情面での自動化の許容度と、生成ＡＩの利用によって得られる効率化などの恩恵度合を考慮して、最適な利用ラインを選択していくと思います。人によっては、まったく利用しないという選択も考えられるでしょう。

今井翔太『生成AIで世界はこう変わる』

私は、この予測は長期的には真だと思います。
無論、他人の権利を侵犯して作成したデータセットに依拠しないアルゴリズムやモデルを利用して、という前提がつきますが。

ただ、この予測は別の問題を提起しています。それは、各アーティストが決定した「最適なAIの利用ライン」の客観的妥当性についてです。どういうことでしょうか。

たとえば、イラストが2点あり、片方は全くAIが利用されておらず、もう片方はほぼAIで仕上げられている状況を考えます。
双方の作品の作者は、それぞれ「自分は最適なAI利用を行った」と考えているとします。
鑑賞者である私たちは、その言い分に納得できるでしょうか？
できる、と断言できる人もいることを、私は理解しています。人間が作ろうが、機械が作ろうが美味しいおにぎりはおにぎりだ、という考え方です。

一方、人間は、AIよりも人間が描いたとされる作品を、その事実に関わらず選好する傾向があることが報告されています（Lucasらの『Humans vs. AI: Whether and why we prefer human-created compared to AI-created artwork』（2023）など）。

現代の人間は少なからず「創作においては、AIよりも人間が作った方が価値がある」という価値観があるようです。
自己批判的な言い方をすると、私たちは支配されていると言ってもよい。AIを取り巻く言説空間の政治的正しさがそうさせているとも言えます。私自身、そのような人間中心主義的バイアスに自縛されていると言えるかもしれない。

これは祈りのようなものかもしれません。私の中の人間讃歌と、人間が有史以来築いてきた美術文化に対するリスペクトがそうさせるのかもしれない。
今の私は、この感覚を大事にしたいと思っています。

AI利用した作品であることを知る権利

さて、「自分は最適なAI利用を行った」それ自体は当事者の主観問題に過ぎないのですが、社会的・鑑賞者的には客観的問題があります。
つまり、「人間が操るマシンと、ほぼレベル5自動運転のマシンが混走している状態」のF1レースを鑑賞者は観ることになるわけです。

このような混走レースは、たとえば将棋の電王戦のように、ある条件下で関係者の合意のもとで行われる分には、無論誰も異論を挟まないでしょう。
しかし、現実社会ではレギュレーションやゾーニングはありませんし、画像生成AIの発達は「AI生成」であることの秘匿を助ける可能性もあります。

作品にAIがどの程度使われているかを、ブロックチェーンのように刻印する技術はまだ普及していません。
AI利用した作品であることを知る権利、というものが世の中でどれくらい重要視されているのか、私は寡聞にして知りませんが、今後強く要請されていくのではないか、と思います。
その際、「どこまでAIの手が入っていたら、人間の創作とは言えないのか」といった難題と正面から向き合う必要が出てくるでしょう。

おわりに

私はなにかの事象について考える時、これで誰が幸福になって、誰が不幸になったのかなとよく考えます。
世の中は、今日、少しでもよくなったのかなと、寝る前に考えます。

画像生成AIは、アナログ・デジタル問わず、絵画技術を持たない人を含め、多くの人のクリエイティビティを刺激し、人間が能力を伸長する契機になる可能性があります。
ただ、誰かが嫌な思いをしたり、我慢を強いられる技術は悲しいなと思います。幼稚な感想ですが、素朴にそう思っています。

生成AIに対する懐疑論に対して、ラッダイト運動を引き合いに出す人もいますが、多くの懐疑論者や反対者は、反AI主義者ではなく、企業やエンジニアの無配慮さや、フリーライダーなエンドユーザーによる搾取的な態度こそを問題視していると思います。

さらにその先にある、人間の文化的活動とAIとの距離という難しい問題をいかに論じ、折合いをつけていくかという本質的で哲学的な問題に、早くみんなで到達したいです。

建設的な議論と理性的な倫理観の上で、科学技術と美学の幸福な未来を願っています。そのために、できることや、勉強をすこしずつしていこうと思います。