AIによる表現民主化の議論

2024年9月15日 17:45

生成AIによる画像生成は、ここ数年で目まぐるしく発展してきました。

2022年頃、生成される画像のクオリティは高くなく議論には及んでいませんでした。
一方で2024年に入り、Stable Diffusion, Midjourney, ImageFXなど、サービスのクオリティが急激に高まりました。それにより、誰でも簡単にそれなりの画像を生成できるようになってきています。

「表現」ということに対して、多くの人が参画できる門戸が開かれたという点で、ひとつの選択肢が登場したとも捉えられます。
一方で、果たして生成AIを利用した画像生成は表現にあたるのかという論点があります。
そこで今回は、生成AIによる表現について掘り下げたいと思います。

なお、筆者はアート領域の学術的な専門家ではないため、この記事で明確な答えを提示するものではなく、みなさんと考えていければと思っています。

表現とは

さて、そもそも「表現」とはどういう意味なのでしょうか。

Weblio辞書には以下のように記載があります。

表現（ひょうげん、英語: expression）とは、自分の感情や思想・意志などを形として残したり、態度や言語で示したりすることである。また、ある物体や事柄を別の言葉を用いて言い換えることなども表現という。

https://www.weblio.jp/content/%E8%A1%A8%E7%8F%BE#google_vignette

また、ChatGPTにも質問してみました。

「表現」とは、内面にある感情、思考、イメージ、経験、観察などを外部に可視化し、他者に伝える行為です。これは言葉、音楽、絵画、演技、デザイン、写真、身体の動き、AIアートなど、多様な手段を通じて行われます。表現は、単なる情報の伝達にとどまらず、創造的なプロセスであり、自己の個性や独自の視点を外に示す重要な行為です。

表現の本質的な特徴として以下の点が挙げられます：
内面の具現化: 表現は、個人の内面にある抽象的な感情や思考を、具体的な形として表出することです。これは他者に理解されやすい形で提示されるため、自己表現や他者とのコミュニケーションの手段となります。
コミュニケーション: 表現は他者とのコミュニケーションを生む手段でもあり、表現者が何を伝えたいか、どう感じているかを共有するために行われます。
創造性と個性: 表現には創造性が求められます。独自のスタイルや技法を通じて、他者と異なる形で自分を伝えたり、世界を解釈したりすることが、表現の本質です。
反応の喚起: 表現はしばしば、受け手に感情的、知的な反応を促すことを目的としています。感動、共感、思索、時には挑発的な反応を生むこともあります。

https://chatgpt.com/

雑に整理すると、「人間が創造性をもちながら自己の思想を形にし、他者に伝える行為」とも言えるでしょう。

伝達する手法に関して具体的な規定はなく、あくまで大枠としての概念が示されています。

AIの民主化

表現の民主化の話に入る前に、AIの民主化について触れておきましょう。
総務省のホワイトペーパーで言及されています。

専門的な言葉が多いと思いますが、比較的分かりやすい部分を抜粋します。

このように、様々なリソースが広く使えるようになってきていることにより、AIを利用することのハードルが下がって来ていることが、「AIの民主化」であるといえよう。「AIの民主化」の中で、例えば自社の競争力の源泉となるものについては、自ら開発する、あるいは自らデータを用意して学習させる形でAIを利用し、そうでないものについては、既存の学習済みモデルを利用するといった使い分けの判断が必要となってくるだろう。他方、この「AIの民主化」を支える基盤の多くは、大手デジタル・プラットフォーマーが提供しており、AIを巡るエコシステムがこのようなデジタル・プラットフォーマーに大きく依存する姿が、どのような影響を及ぼしていくのかは、注視が必要といえよう。

https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r01/html/nd113220.html

ここではビジネス観点で書かれていますが、個人レベルにおいても一定共通していると思われます。
つまり、「AIのスキルを身につけなくともAIを活用したサービスを利用できる」ということです。

例えば、生成AIのサービスは文字、動画、画像、コーディングだけでもかなり多くのサービスが展開されています。
ChatGPTなどはイメージしやすいと思いますが、自然に人間に質問するように扱えばよいので、誰でも利用できることがわかります。

他にも、生成AIを使ったサービスは相当な数が出ています。

https://pixelplex.io/blog/generative-ai-market-map/

表現の民主化

次に表現の民主化について考えてみましょう。

表現自体はそもそも民主化されている、つまり誰でも表現をすることが可能です。
ここでは、真の意味での民主化ではなく、参画するハードルが下がるという意味での民主化と捉えて考えてみましょう。

生成AIを誰でも簡単に扱えるようになったことは、AIの民主化の項目で触れました。それでは、生成AIで作成した画像は表現にあたるのか、ということが次の論点になります。

表現とは、「人間が創造性をもちながら自己の思想を形にし、他者に伝える行為」というように整理しました。
キーとなるのは、「創造性をもちながら」をどう捉えるかになります。

シンプルな例を提示します。

生成した街の画像が2枚あります。
片方はプロンプトに複雑性があり、もう片方はシンプルなものになっています。

さて、どちらがより複雑なプロンプトで生成した画像でしょうか。

実際のプロンプトは以下のようになっています。

街①

Ruined abandoned city in the UK. --s 250

街②

Ruined abandoned city, historical and majestic buildings, covered with plants, stunning twilight, looked from high building, in winter, realistic photo --no actors people --s 250

明確に街②の方がプロンプトが複雑になっています。入力者の意思があると一定感じることができます。

街①の画像はとてもシンプルなプロンプトであり、何かを表現しようとする意図を読み取ることはできないと思います。

生成された画像だけを見るとこのコンテキストを読み取ることは難しいという点が、生成AIによる表現の有無で議論が分かれる要因になっていると思います。

画像の生成を終えるまでの時間についても、大きな差があります。
例えば先ほどの街①を生成して完了とすると、せいぜい所要時間は数分です。
一方で、街②の画像生成をベースに、納得のいく表現ができるまで再生成や修正を加えていく場合、平気で数時間を超える場合もあります。

こちらも同様に、最終的に生成された画像からは読み取れない情報になります。

このように、意思を込めたものを出力するにはかなり時間が必要になってきます。
プロンプトの複雑性や再生成の数、微修正の手数などが膨大になります。
そうするとそれなりの経験や時間が必要となり、民主化とは言えないのではないかという見解もありそうです。

また、意思を込めるという手段は多様です。写真にAI補正をかける、写真をもとにAI生成する、AIで画像修正をする、AI生成画像を微修正をする、AI生成を繰り返す、プロンプトを細かなものにするなど、境界は曖昧です。

表現の民主化としてのひとつの可能性は、表現手法に制約がある人への選択肢です。
例えば体が不自由で写真を撮りに外出できない、筆を取ることができない、そういった場合にはプロンプトをベースとした表現は有益な選択肢になり得るはずです。

すでに熟練した表現技法を習得した人、例えばフォトグラファーやイラストレーターではなく、表現する方法を持ちたくても持てていない場合に、大きな可能性があると思います。

さいごに

さて、長くなりましたが、本記事をChatGPTに3行でまとめてもらいました。

生成AIの進化により、誰でも簡単に高品質な画像を生成できるようになり、表現の民主化が進んだ。
しかし、生成AIによる画像生成が「表現」といえるかどうかは、創造性の解釈やプロンプトの複雑性により異なる。
また、表現手段が限られた人々にとって、生成AIは新たな表現手段としての可能性がある。

https://chatgpt.com/

AI廃墟はコンセプトをもとに世界観を構築しています。
退廃した架空の世界を猫が旅する。そこに鑑賞者が感性を投影し、空想を楽しむもの。
この世界観は表現としてインストールされるものなのか、議論の素材になれば幸いです。

感想や気になる点があれば、XのDMでお願いいたします。

この記事が気に入ったらサポートをしてみませんか？