見出し画像

画像生成AIは見える世界をどう変えるか

つい今さっき、昼過ぎにアイスを食べながらChatGPTを開いたら、画像生成AIのDALL-E3の統合が追加されてた。ChatGPTの対話UI上で画像生成の指示が出せて、その場で画像が作れるやつだ。

幾つか試してみたところ、すごすぎて頭がクラクラした。

太極サッカー
狩野派の機関車。….めっちゃ良くない??全部すごい好き。

そんで画像生成AIの進歩に驚愕して、あらためてこれが人間にどんな影響をもたらすだろうかと、駆け足で考えた。以下はその走り書きにも等しいメモである。



これは紛れもなく、思考/想像力に現実が追いついてしまう事態だろう。

現実世界にはありえないものを好き勝手組み合わせて心のなかで作った観念が、現に目の前にありありと表象してしまう。個々人にオリジナルなどんなにニッチな妄想も、この世界に産み落とされてしまう。

ここまでくれば、自分の思い描いた世界がどんどん眼の前で実現されていく未来まではあと一息なように思う。VR空間限定の話では決してなくて、3Dプリンター等も介しながら、自分が受け取る視覚情報がどんどん自分の想像力に由来したもので埋め尽くされていくだろう。

思考されたものが、即座に現実となる。この事実を、人ははじめは驚きをもって迎え入れ、さながら自分が神にでもなったかのように振る舞うかもしれない。


その初期の邂逅における衝撃の念は、長く続かないだろう。そして人々は、訪れた全くあたらしい世界をごくごく自然なものとして捉えるようになり、この事態そのものが意識の内奥に退いていくはずだ。

我々は、自らの身体を好き勝手に動かせる。自分が思い描いたとおりに、ほとんど何の抵抗もなく使役できる。自然界にある他の物体と同様、自然法則に従うのみに思える手足が、なんと自分の意のままにできる。人間の身体と心の関係がまだほとんど解き明かされていなかった時代、身体は大いなる謎であり、ほとんど奇跡に近いものだったはずである。しかし、人間はそれに驚くことはない。頭のてっぺんから足の指先まで、すべては自分のうちに含まれ、それを使って世界と交流していけるものと見なしている。

AIを使った表象の改変も、同じような見なされ方に落ち着くだろう。見えている景色が都度自分の想像通りに変わっていくのはまったく当たり前の事柄になる。それは自分が念ずれば指を折り曲げられるのと同じぐらい自然なことで、それ自体がもはや自分自身の一部になる。


体が自分の自由になるということと視覚世界が自分の自由になるということのあいだには、どんな相違があるだろうか。この問いに取り組むことで、この技術が社会にどういう影響を及ぼすかに多少なりとも迫れるかもしれない。

一つには、ひとがなにかの情報を処理する際に、視覚情報の占める割合は非常に高い。見えている世界が現実で、なんなら見えている世界を自分好みにするために、人は体や頭をせっせと動かしてそれぞれの生を活動している、とまで言えるかもしれない。とすると、見えるものが思うがままになるというのは、ある意味で人生の目標みたいなものを全て満たすことになるかもしれない。あるいは、すべて消し去ることになるかもしれない。

自分だけの世界に入り浸って暮らしていきたいと願う人は多いはずだ。自分が望むものを見て、望むものだけを摂取する。身体の自由は自らをより外へと働きかけるが、視覚の自由は我々をして、それ自体を目指して内へ内へと落ち込んでいく運動を形作るかもしれない。

もちろん、生存のための最低限の活動は必要であり続ける。食べる。食べ物を買う。食べ物を買うために働いてお金を稼ぐ。でも、働くという行為すら、自らに都合のいいような表象に埋め尽くされたまま為され、自らが思念した通りのものが産み落とされるとすれば、その労働は今よりもずっと個人的で、"他の"世界とは独立した性格を帯びることになる。

ふだん自分に見えている世界は全く自由に構築可能だが、個々の「自分の世界」同士が衝突するとき、あるいは特権的な「ただ一つの現実世界」への参入が要請されるとき、かつてあったと同様の不自由が生じる。どの「自分の世界」が優勢となるべきかを巡って、ある種の政治がそこかしこで繰り広げられる。ただそれでも、食物や聖地なんかを巡る闘争と比べて、少なくとも現時点では、僅かなサーバーリソースの消費でしかない画像生成が他者(の世界)を淘汰するほどの排他的欲求に繋がることは考えにくい。

自らの好きな世界に生きられるとき、人がどの程度まで社会的な承認や虚栄心の充足、妬み、共感、愛情といった社会的な価値を求めて他者の世界に入ることになるかは、重要な論点になる。自分の生の範囲をどこまでで良しとするか、ここはだいぶ個人差があるところだろう。


身体と視覚のもう一つの違いは、視覚の方がより一層、言葉と意味に多くを負っている世界だという点だろう。われわれが見ているものはある程度までは言語によって構築されているし、範疇的な認識から逃れることは難しい。

生成AIが視覚を司る未来では、見えるものはまず語られるものとしてであり、言語的な表象がこれまでよりも幅を効かせるようになる。ことばで言い表す事の難しいニュアンス的なもの、雰囲気的なもの、情動的なもの、そして範疇的なものからあぶれた偶有的なものは、我々の意識にはあまり登らなくなるかもしれない。そうしたものが存在することをやめるのではなく、言語→視覚的表象の即時性に慣れきってしまったときに、視覚はあまりにも自然に言語と密に結合し、そこからはみ出たものを解釈する間もなく、どんどんと新たな言語的-視覚的表象を積み重ねていく連鎖が走っていく。

ただ、この範疇的なものにも、問題が潜んでいなくはない。

想像力は自由とは言え、必ずプロンプトによる指示を介さなければならず、それを基にして自分だけのユニークな視覚世界が生まれ落ちるのだった。すると、自分の目の前にある表象/対象の本質―それがそれであるところのもの―は、自らによって初めて記述され組み合わされたものであるからには、既存のカテゴリーに入らないものばかりだろう。

とはつまり、範疇的な世界の把握(=種-類による対象の名指しとその概念的把握)は力を失い、世界は魑魅魍魎の跋扈するドロドロのなにかわけのわからないものになる。未だかつて存在しなかった「なにか」でいっぱいに埋め尽くされた視界のなかで、その世界の表象においては隣人と分かり合えることはなく、驚き合うことができるとしても、驚くための基準に乏しい。自分が見ているものがなんなのか、確定的に記述できるのは世界に自分しかおらず、世界の内実はつねに自分のうちにしか存在しない。

ただ、それに尽きない点も挙げておこう。視覚世界を自由に生み出すために、所与の言語体系から始めなければならないのであった。

言語の世界は他者の住まう世界であり、ここでは必然的に、思い通りにならない他者性と関わらざるを得ない。想像力の羽根をどこまで大きく広げ、どこまで遠く飛ぼうとしても、自らが操れる言語の外へは行けず、またそれは属するコミュニティと文化から多大なる影響を受けている。上では他者の世界へ参与せずとも生きられる可能性を述べたけれど、実際にはただ、そうできるという思い込みがあるだけである。

ただこれはむしろ、ポジティブに取られられる面もあるかもしれない。好き勝手考えたことがどんどん眼前を埋め尽くして変化していく世界にあっては、自己とその所在を見定めるのは難しくなる。思考=世界である事態にあって、あくまで世界に対向するものとしての「自分自身」が存在し生きていることの確証がなければ、文字通り人は生きてはいけない。それを見出すためには、目まぐるしく変わっていく想像的世界のなかで、なんらかの安定した構造ないし輪郭が必要になる。

つねに自由に動かせ、つねに変化し続ける身体が、それでもつねに自分自身の身体として一つのものであり続けるのは、それが自己という安定して連続的な構造と同一の輪郭のうちにあるからである。主体があるからこそ一時的なものとしての運動があるわけで、あらゆる表象が継起し続けるなかでそれに対する主体がなければ一人の人が生きていく事はできない。その意味で、自分が操ることばの、つまり視覚的表象の変化における限界と偏りは、そのうちにいくばくかの安定した部分や濃度の濃さを見出し、自分の範囲がおぼろげながら浮かび上がってくる。かつて属していたコミュニティ特有の言葉遣いや、組み合わせの癖が、自分の出自を明かし、自分の存在を変わりゆく世界に刻む。個人的な気質というのも、こういう部分に被さって知られてくる。こういう形でしか、人間は自己というものを測れないようになるかもしれない。

先の範疇的な対象の認識にしても、こういった輪郭から徐々に復活してくるかもしれない。この限界は、個々の視覚世界に内在的なのではなくて、生成AIの内部プロセスに内在的なものであり、それらが参照している"旧世界"での人間の膨大な言語活動/表象活動により枠付けられている。



バーッと書いてみて、結構否定的なニュアンスが多いなと思った。このイノベーションを前にして驚異と興奮冷めやらぬ勢いで書いたわりに、である。どうも事態はそれほど単純じゃないらしい。

うーんでもやっぱすごい、おもろい、機関車めっちゃかっこいい、意のままに作れてアツい、と感じる自分がいるし、「脳波→プロンプト→網膜ディスプレイ」に早くなれよと急かすテクノロジー信奉者としての自分もいる。

思えば、技術もある意味で神のようなもので、信奉するに足るものではある。そして、見えないものをいかにして見るか、を侃々諤々してきたわれわれ人類ではあった。

はるか昔から、言葉は神性と結びついてきたのだし、古代文明の神官たちは言葉によって民衆の支持を集め、王による統治に抗った。すべての世界宗教は聖典/聖句と御言葉がそれ自体として神を宿すと教えてきた。

視覚に関しては、その限りではない。キリスト教にはイコノクラスム(聖像破壊運動)と公会議での紛糾した議論の歴史があり、イスラム教は今でもイコン(聖画像)を認めていない。生気に満ちて勢いのある視覚の世界は、人をそれ自体として驚かせ、神へと通じる観想の回廊を閉ざしてしまうところがある。目に見えるものが持つパワーがいかに強いか、ということである。

言葉が即視覚的表象であるような時代には、神は八百万の形象を伴って舞い乱れるかもしれないし、人も背後世界の普遍性を忘れて一緒に踊り狂うのかもしれない。

頂いたサポートは、今後紹介する本の購入代金と、記事作成のやる気のガソリンとして使わせていただきます。