AIによる表現民主化の議論
生成AIによる画像生成は、ここ数年で目まぐるしく発展してきました。
2022年頃、生成される画像のクオリティは高くなく議論には及んでいませんでした。
一方で2024年に入り、Stable Diffusion, Midjourney, ImageFXなど、サービスのクオリティが急激に高まりました。それにより、誰でも簡単にそれなりの画像を生成できるようになってきています。
「表現」ということに対して、多くの人が参画できる門戸が開かれたという点で、ひとつの選択肢が登場したとも捉えられます。
一方で、果たして生成AIを利用した画像生成は表現にあたるのかという論点があります。
そこで今回は、生成AIによる表現について掘り下げたいと思います。
なお、筆者はアート領域の学術的な専門家ではないため、この記事で明確な答えを提示するものではなく、みなさんと考えていければと思っています。
表現とは
さて、そもそも「表現」とはどういう意味なのでしょうか。
Weblio辞書には以下のように記載があります。
また、ChatGPTにも質問してみました。
雑に整理すると、「人間が創造性をもちながら自己の思想を形にし、他者に伝える行為」とも言えるでしょう。
伝達する手法に関して具体的な規定はなく、あくまで大枠としての概念が示されています。
AIの民主化
表現の民主化の話に入る前に、AIの民主化について触れておきましょう。
総務省のホワイトペーパーで言及されています。
専門的な言葉が多いと思いますが、比較的分かりやすい部分を抜粋します。
ここではビジネス観点で書かれていますが、個人レベルにおいても一定共通していると思われます。
つまり、「AIのスキルを身につけなくともAIを活用したサービスを利用できる」ということです。
例えば、生成AIのサービスは文字、動画、画像、コーディングだけでもかなり多くのサービスが展開されています。
ChatGPTなどはイメージしやすいと思いますが、自然に人間に質問するように扱えばよいので、誰でも利用できることがわかります。
他にも、生成AIを使ったサービスは相当な数が出ています。
表現の民主化
次に表現の民主化について考えてみましょう。
表現自体はそもそも民主化されている、つまり誰でも表現をすることが可能です。
ここでは、真の意味での民主化ではなく、参画するハードルが下がるという意味での民主化と捉えて考えてみましょう。
生成AIを誰でも簡単に扱えるようになったことは、AIの民主化の項目で触れました。それでは、生成AIで作成した画像は表現にあたるのか、ということが次の論点になります。
表現とは、「人間が創造性をもちながら自己の思想を形にし、他者に伝える行為」というように整理しました。
キーとなるのは、「創造性をもちながら」をどう捉えるかになります。
シンプルな例を提示します。
生成した街の画像が2枚あります。
片方はプロンプトに複雑性があり、もう片方はシンプルなものになっています。
さて、どちらがより複雑なプロンプトで生成した画像でしょうか。
実際のプロンプトは以下のようになっています。
街①
Ruined abandoned city in the UK. --s 250
街②
Ruined abandoned city, historical and majestic buildings, covered with plants, stunning twilight, looked from high building, in winter, realistic photo --no actors people --s 250
明確に街②の方がプロンプトが複雑になっています。入力者の意思があると一定感じることができます。
街①の画像はとてもシンプルなプロンプトであり、何かを表現しようとする意図を読み取ることはできないと思います。
生成された画像だけを見るとこのコンテキストを読み取ることは難しいという点が、生成AIによる表現の有無で議論が分かれる要因になっていると思います。
画像の生成を終えるまでの時間についても、大きな差があります。
例えば先ほどの街①を生成して完了とすると、せいぜい所要時間は数分です。
一方で、街②の画像生成をベースに、納得のいく表現ができるまで再生成や修正を加えていく場合、平気で数時間を超える場合もあります。
こちらも同様に、最終的に生成された画像からは読み取れない情報になります。
このように、意思を込めたものを出力するにはかなり時間が必要になってきます。
プロンプトの複雑性や再生成の数、微修正の手数などが膨大になります。
そうするとそれなりの経験や時間が必要となり、民主化とは言えないのではないかという見解もありそうです。
また、意思を込めるという手段は多様です。写真にAI補正をかける、写真をもとにAI生成する、AIで画像修正をする、AI生成画像を微修正をする、AI生成を繰り返す、プロンプトを細かなものにするなど、境界は曖昧です。
表現の民主化としてのひとつの可能性は、表現手法に制約がある人への選択肢です。
例えば体が不自由で写真を撮りに外出できない、筆を取ることができない、そういった場合にはプロンプトをベースとした表現は有益な選択肢になり得るはずです。
すでに熟練した表現技法を習得した人、例えばフォトグラファーやイラストレーターではなく、表現する方法を持ちたくても持てていない場合に、大きな可能性があると思います。
さいごに
さて、長くなりましたが、本記事をChatGPTに3行でまとめてもらいました。
AI廃墟はコンセプトをもとに世界観を構築しています。
退廃した架空の世界を猫が旅する。そこに鑑賞者が感性を投影し、空想を楽しむもの。
この世界観は表現としてインストールされるものなのか、議論の素材になれば幸いです。
感想や気になる点があれば、XのDMでお願いいたします。
この記事が気に入ったらサポートをしてみませんか?