見出し画像

AI利用に関する覚書(1) 5/n

4. 覚書(1) ボトムアップAIとトップダウンAI

私の理解では、AIは大きく分けて「ボトムアップAI」と「トップダウンAI」の2種類が存在すると考えています。

私が最初にこれらの用語に出会ったのは、「ソードアートオンライン(川原礫著)」という電撃文庫で連載しているライトノベルです。

この小説ではボトムアップAIとしてユイ、トップダウンAIとしてアリスが対比されており、物語全体を通して、ボトムアップAIとドップダウンAIの違いを読者が実感できるように描かれています。

ボトムアップAIはその名の通り、1からルールを記述して人の知能のように振る舞う計算機のことだと私は理解しています。

例えば、日本語から英語に翻訳するAIに日本語の文章「私は生徒です」を与えると、「I am a student」という翻訳された英文だけを返しますが、「これは某英会話教室の宣伝動画使われているキャッチコピーです」というような捻った回答を返すことはありません。

それに対して、トップダウンAIは赤ちゃんの頭脳のような成長可能な箱(無限次元といえるほど大規模なニューラルネットワーク)を用意し、外部刺激とそれに対する模範解答の組(学習データ)を使って学習し、新しい外部刺激(文章生成AIでいえば「入力する文章」、画像生成AIでいえば「キーワード」)の入力に対して、多くの人が好みそうな解答(文章生成AIでいえば「望みに近い文章」、画像生成AIでいえば「望みに近い画像」)を返すという、まるで人の知能のように振る舞う計算機のことだと私は理解しています。


図5. ボトムアップAI(Memeplex.appで作成)画像生成の条件:bottom up artificial intelligence(呪文)、SDXL1.0(AIモデル)、イラスト(画風設定)、ハイファンタジー風(スタイル指定)、4K風(作風指定)で生成。
図6. トップダウンAI (Memeplex.appで作成)画像生成の条件:bottom up artificial intelligence, G solar ray(呪文)、SDXL1.0(AIモデル)、イラスト(画風設定)、ハイファンタジー風(スタイル指定)、4K風(作風指定)で生成。

学習過程から明らかなように、ボトムアップAIでは特定の処理しかしないため演算回数は比較的抑えられるのに対し、トップダウンAIでは汎用性を確保するために冗長的な処理を行うため演算回数は比較的大きくなると思われます。

また、トップダウンAIでは入力と出力の結びつける際に用いる成長可能な箱のサイズ(入力と出力の接続方法。例えば、Diffusionモデルでは「キーワード」と「画像のピクセル列」の間を直接変換する接続方式になっていると私は妄想しています(^_^;) その他のモデルでは「画像のピクセル列」の他に「画像のピクセル列の勾配/曲率」の間を変換する接続方式になっていると私は妄想しています(^_^;))の増加に対して演算回数が大きくなるため、生成AIごとに文章や画像の返答速度が変化するのはこのためだと私は想像しています。

次の記事:https://note.com/wataruyoshida/n/n77a555676fc7