「脳内イメージを具現化できたら俺も神絵師なのに」批判

2024年4月21日 20:31

「脳内イメージを具現化できたら俺も神絵師なのに」
と思ったことはあるでしょうか。
あるいはもっとシンプルに、
「頭の中のイメージを絵に出来たらいいのに」
とか。

これらに類する気持ちを持ったことがある人は多いと思います。自分もです。
最近はイラストAIまわりで見ることが多いように思いますが、SF小説の中でもよく登場しました。「脳内イメージ具現化装置」みたいなガジェットはよくあったと思います。2023年には実際にfMRIと生成AIを使って脳内イメージ（メンタルイメージと呼ばれる）を画像に変換する装置の研究が発表されました。

しかし、果たしてそのイメージというのは存在するのでしょうか。
存在するかどうかは極端な言い方でした。言い換えるなら、それはどの程度信頼できるものなのでしょうか。思ったよりも情報量の無いものなのでは。ましてや、「俺は絵が描けないだけでイメージはすごいので脳内を読み取ってもらえたらすごい物が出力されるのに」は、疑わしいのではないかと私は思うのです。

絵を描くという行為について考えます。絵描きもいわゆる〝イメージ〟を持って白いキャンバスに向かい、いざ描き始めると上手くいかないということがあると思います。絵描きでさえそうなのです。普通の人の脳内イメージとはいかほどのものでしょうか。

物を見るという行為について考えます。たとえば人間が猫を見たとき、デジカメのようにその画像が脳にコピーされるわけではありません。その解像度の低い不可逆圧縮版でさえ保存されていないでしょう。保存されるのは言語に符号化された少量の情報を除けば、画像としてはぼやけ、かつ単純な、きわめて情報量の低いものだと思います。線や単純な形に抽象されたものを記憶する場合もあるかと思います。

想起する際も、そのかなり情報が削減された曖昧な像を思い出しているはずです。あるいは、それは猫を認識するときに活性化する脳の部位が少し反応する、という程度のものかもしれません。それは曖昧な画像が保存されているとさえ言えないレベルでしょう。
前述した脳内イメージ変換装置は、生成AIのちからを借りてある程度精細な画像を出力しました。しかしこれはメンタルイメージが生成AIにおけるi2iのような役割をしており、純粋に脳内からの復元というより外部検索に近い要素があると思います。

そうした力を借りなければ、メンタルイメージというのはかなり情報量の少ないものであると私は考えます。
脳は「画像そのものの情報」ではなく、「画像を見たときに脳自身のどこが活性化するか」を記憶しているに過ぎないのです。
ここで問題があります。脳内に精細なイメージが無いのならば、なぜ絵描きは精細な絵を描けるのでしょうか。
絵の詳細、精緻さや豊潤な複雑さは、脳と画面の間のどこで生まれるのでしょうか。手でしょうか。
計算に置き換えて考えてみましょう。方程式と変数が決まっていても、実際に計算してみなければどうなるかわからない。物理法則の完全な統一理論とビッグバンに関する初期値が与えられても、それだけでは一つの宇宙というインスタンスが存在することになりません。
この比喩において、法則や変数はメンタルイメージに、実際の計算結果が絵画に対応しています。
つまり絵画とは計算結果であり、絵を描くとは演算するということなのです。
「イメージを絵にしてくれる機械」というのは文字通り、その演算を外部化してしまう機械のことです。
このことから、「やはり俺の脳内には設計図があるが、具現化できないだけで、それをするのが生成AIなのだ」と思うか、「いや、演算こそが絵の本質なのであり、それを欠いた脳内イメージは無意味なのだ」と思うかが問われます。私は後者を押したいのです。

私は人間とAIの違いについて語りたいのに、類似について強調してしまいました。
先ほどは〝計算〟という比喩を使ったから、法則さえ用意すれば勝手に展開されるので、計算＝絵を描くという行為は大したことないのでは、ということになってしまいました。
しかし、そうとは思えません。絵描きが脳内イメージから実際の絵を描くまでに、情報量は増えています。なにか圧縮されたものを展開しているわけではないのです。
それは、脳内イメージの持つ情報があまりにも少ないからです。
「その画像を見たときにどの脳神経が発火するかの記憶」は、先程の比喩のような「物理法則」「設計図」とは到底呼べない代物です。
絵描きはその情報量の少ないところから始めて、絵を描いている最中も、その「どこが発火するか」のセンサーを稼働させています。そのセンサーによって絵を常時監視し、修正していくのです。
それは法則や設計図とは呼べないが、すべて同じ遺伝子を持った細胞が、なぜか身体各部に分化できるような、あるいは単純な本能しかない社会性昆虫が、精密に巣を作り上げることに似ています。法則のように決定論的ではなく、設計図のように完成図が決まっているわけではない。創発があります。オートポイエーシス論ではコードと呼ばれるかもしれません。コードは作動結果からのフィードバックを受けて、それ自体変化することもあります。

「どこが発火するか」センサーを、実際に紙（画面）上で稼働させながら選択していくのが絵を描くという作業ならば、やはり実際に描いてみるまではわからないのです。絵は描かれるまでは存在しないということでもあります。脳内にさえ存在しないのです。
もちろんそれには一定の反論が可能です。脳内でエスキースを描いてそれをキャンバスに写すという行為もまたあるからです。しかしそれはあくまで概略にすぎません。簡易的なシミュレーションに過ぎません。細部まで記憶するメモリが脳にないからです。（先ほどから、直観像保持者のことは、どの程度正確な記憶なのかよく知らないので除外しています）

私はこれを人間特有の行為のように感じますが、AIユーザーには異論があるでしょう。生成AIも隣接するピクセルに対する統計から順に判断していくものであることから、あたかも描画しているように思われます。GANは認識的センサー、VAEはエスキースに相当します。拡散モデルは想起でしょうか。
しかし違いといえば、人間特有の曖昧さと、やはりコードが変わっていくということでしょう。人間が変動するコードに従うことで嫌でも創作的になってしまうのに対して、生成AIは正確に記憶したパターンを復元するための関数を変えることがありません。これらのことから、私は生成AIの生成物は創作ではなく復元の一種だと分類しているのです。

以上で、「脳内イメージを具現化できたら俺も神絵師なのに」の夢想を否定することができたのではないでしょうか。もしそのいわゆる「具現化」を現行の生成AIのようなものを使って行うなら復元に近いものとなってしまい、逆に脳内の情報を重視すれば情報量の小さすぎるものになってしまうでしょう。なぜなら、創作性も情報量も、描くという行為の中でのみ生まれるからです。

この記事が気に入ったらサポートをしてみませんか？