ボトムアップ・トップダウン

物事には二つのやり方がある。

AIイラストはそれを浮き彫りにする好例だ。
手描きのイラストは通常、線を描き、色を置き、陰影や様々な効果を盛っていくように、極一部の構成要素を少しずつ形作ることで何が描かれているかが分かってくる。つまり詳細(ディティール)から出発して、徐々に全体へと到達する。最初にレイアウトや配色を考える工程があるにせよ、やはり全体像ではなく線などの基本要素が最初にキャンバスに現れる。

一方でAIイラストはそうではない。「girl」などただの一言でさえ、まず全体像が出来上がるのだ。そして必要に応じて詳細の方を調整していく。

これは正にボトムアップとトップダウンであって、ボトム(下部、詳細)からかトップ(上部、全体)からか、という二つのやり方が対峙している。

この流儀の違いは発展の仕方の違いでもある。手描きであれば、レイアウトの進化だとかいうことはあまり言われない。進化するのは何よりもまず絵柄だ。
一方でAIイラストの「絵柄の進化」というのは非常に難しい。様々な作品を見ていれば分かるように、その絵柄は極めて平均値的な特徴に欠けるものか、明らかに参照先が存在する「誰々風」のものか、のほぼ二択だ。絵柄をプロンプト(指示文)で調節するのは困難で、まして今までにないものを追求するとなると至難だろう。
原理的にもAIイラストの使う画像生成モデルとは、学習データの画像を「再現する」というタスクをこなすものであるから、要素の組み合わせという形に創造性が制限されるのは自然に思われる。

勿論要素と言っても色々なレベルがあり、下からの進化が不可能とは言わないが、それよりも正直に上からの方が相性は良い。手描きではコスト(俗にカロリーと呼ばれる)が比例的に増加する多人数のイラストなどはそこを活かしていると言えるが、現状あまりトップダウンの進化が起きている印象はない。
すると上記のようにイラストの進化はただ手描きのイラストレーターによってボトムアップで起き、学習によって画像生成モデルが吸収するのみになる。従来のイラストレーターの反動的な反応も道理と言えるだろう。

さてボトムアップ・トップダウンという分類はAI自体にも存在する。
かつてAI研究と言えば専門知識による問題解決を模すエキスパートシステムだとか、チェスなどのゲームで勝つだとか、論理的思考の再現が追及された。それは現実の映像などではなく、駒がどこにいるとかの抽象的情報を処理し、具体的にチェスの棋譜で言えば「1.e4 c5 2.c3」といったもの、つまり記号の列になる。記号主義(シンボリズム)と呼ばれるこの流儀がAIにおけるトップダウンだ。

一方で近年発達した深層学習は脳の神経回路を模したもので、特に畳み込みを活用した画像処理などは実際の視覚野の挙動に近い。ChatGPTなど文章を扱えるようになったのは長年の研究の成果であり、基本的にはパターン認識的な、具体的情報を扱う方に長ける。コネクショニズムと呼ばれるこの流儀がボトムアップのAIとなる。

ソフトウェア開発ではウォーターフォール型及びアジャイル型と呼ばれる開発手法があるが、前者が機能や説計から決めていく点でトップダウンなのに対し、「Done is better than perfect」の後者は動く最小部位から始める為ボトムアップ的と言える。
ある程度の規模があるなら、全体設計は必要だ。それがソフトウェアの成長に従って変更を迫られるとしても、その成長はまず動くものがなくては起こり得ない。

物語を書くに当たっても全体の進行を念頭に置いているタイプと、いわゆる「キャラが勝手に動く」タイプの作家が見られる。

上で視覚野に触れたが、認知というものは常にボトムアップで起きる訳ではない。「幽霊の正体見たり枯れ尾花」とは良くできた言葉で、何かを予想していると、実際の視覚系の中でもトップダウンの信号が走ることが知られている。プライミング効果の先行刺激が内部的になったものとも言えるだろう。また運動においては随伴発射と呼ばれる、運動の結果受ける感覚入力を予測した信号が発生する。

そもそも「ボトム」は物質世界に存在するのに対して、「トップ」自体が人間の認知能力により生み出されるものだ。トップダウンのプロセスは知性体の頭の中にだけある。
連続的な感覚入力から離散的な概念を抽出する能力は分節化と呼ばれる。

概念レベルでもボトムアップの認知はあるが、人間はそこまで多数の概念を同時に処理できない。「マジカルナンバー」という短期記憶に保持できる項目の数を言う概念があり、7±2とか後に4±1とかの説がある。項目とは曖昧だが、もう一つチャンク化と呼ばれる概念があり、人は複数のものを一つに纏めるということが認知的にできる。4±1の方が有力とされている為、7±2は実のところ2つをまとめるチャンク化が自然に起きているのかもしれない。
この点で分割統治法は極めて人間的アルゴリズムと言える。チャンク化を駆使して階層的に物事を認知するのが、人間の複雑な事象に対する向き合い方だ。

もう一つ挙げるとすれば、(辞書的、素朴な意味での)社会正義とでも言うべきものがある。
社会を良くすると言うとき、身の回りの一人々々を幸せにすることから考える人間もいれば、法制度などの面から考える人間もいる。『BLEACH』に「勝者とは常に 世界がどういうものかでは無く どう在るべきかについて語らなければならない」(愛染惣右介)という台詞があるが、問題意識を持ち行動する者、そしてしばしば物語の悪役は後者のトップダウンな社会正義を持つことが多い。
しかし逆の「ただ一人を蘇らせる為にあらゆる手段を取る」ようなタイプを、ある意味で極端なボトムアップと呼んでも良いかもしれない。

古くはイデア論で著名なプラトンが、「正義とは何か」といった抽象的な問いから理想的な国家(ポリス)を考えたのに対して、アリストテレスは現実の国家が現実の国家の統治を観察し、良い統治・悪い統治というものを考えた。これは現代における「大きな物語・小さな物語」まで繋がっているものと思われし、トップダウン的な「大きな物語」の困難は既にそこに書いている。

人間の認知そのものがボトムアップ・トップダウンの両輪で成り立っているのならば、例えばAIの構築もその両方が重要となるはずだ。この点、真の知能(AGI)が今の非常にボトムアップ的戦略で達成されるのかやや疑問にも思える。

この記事が気に入ったらサポートをしてみませんか?