能動的推論とAI

2023年8月24日 09:02

拙著『コンヴィヴィアル・テクノロジー』や、このnote、寄稿した記事やトークイベントなどでも度々紹介している「予測する脳」の話。この数年、注目を集めつつあるようで、昨年はこの原理を提唱したカール・フリストンが著者に名を連ねる本が日本語訳もされた。

なかなか難解でじっくり読む時間も取れないままだったが、ようやく読み始めてみることにしたので今回はその一部を紹介してみたい。

心、脳、行動の統一原理

まず、この話がとても興味深いのは、これが心、脳、行動の統一原理である、つまり、人間を含む生き物の心、脳、行動はすべてこの原理に従っているのではないか、とされているところにある。もしそうだとしたら、これはわたしたちの生活や仕事にも深く関わってくる話である。もしかしたら、この原理をうまく取り入れると（よくも悪くも）人間の心、脳、行動に影響を与えることが出来るかもしれないということでもあり、あらゆるサービスやプロダクトのデザインに大きなインパクトを与えるかもしれない話なのである。

予測と観測の「ずれ」

では、その原理とは一体どのようなものか。それは一言で言えば、脳は予測と観測の「ずれ」を最小化しようとするというものである。

例えば、目の前にあるリンゴを見る時、普通は「リンゴの情報が目を通してインプットされ、それが脳に伝わって処理されて、リンゴだと認識される」という一方向の流れを想像するのではないだろうか。

しかし実際には下の図のように、目の前のリンゴを見る時、わたしたちはまず目の前のものがリンゴであるという予測をしているのだ。そして、実際に観測されたものとの間に「ずれ」がある（例えば食べてみたら思いのほか酸っぱい）時、その「ずれ」（「酸っぱい」という情報）が脳にインプットされ、知覚される。（言い換えれば、予測通りで「ずれ」がない場合、実は観測された環境からの情報は脳にインプットされていないということになる。）

そして、その「ずれ」が今後はなるべく起きないように「リンゴがすっぱい可能性」を加味した形に予測モデルが更新される。

この図が興味深いのは、「ずれ」を最小化するという原理によって、知覚だけでなく行為も説明できるところである。

先ほどの例でいえば、必ずしも「ずれ」をすぐに受け入れて（自分が間違っていた、りんごは酸っぱいものだと）信念を変えるとは限らず、いやそんなはずはないともう一度食べてみたり、たまたま今自分の味覚が変なのかもと他の人に食べさせて確かめたりもする。つまり行為によって「ずれ」を解消しようともするのである。

わたしたちの脳は常に予測をしていて、観測との間の「ずれ」がなるべく小さくなるように予測モデルを更新したり、行動したりする、こうしたプロセスは「能動的推論（Active Inference）」と呼ばれ、予測と観測の「ずれ」は「自由エネルギー（Free Energy）」と呼ばれる。

つまり「自由エネルギー原理（Free Energy Principle）」とは「能動的推論による自由エネルギーの最小化こそが、人間を含む生き物の心、脳、行動を説明する統一原理である」という主張なのである。

推論としての知覚

本書によれば、脳を「予測する機械」と捉えるルーツは、1867年のヘルムホルツ「無意識的推論としての知覚」にまで遡ることができるという。つまり、こうした予測と観測の「ずれ」を最小化するというコンセプト自体は実は新しいものではなく、最近ではベイズ推論に基づく「ベイズ脳」仮説として定式化されてもいる。

ベイズ推論とは

ここでベイズ推論について、本書で紹介されているリンゴとカエルが登場する例を紹介しておこう。

あなたは果樹園にいて、これからリンゴかカエルのどちらかを見ることになるとしよう。「果樹園にはリンゴが多い」「カエルは池にいる」と思っているあなたは、これから見るのは「おそらくリンゴだろう」と予測している。しかし、そこであなたは何かが目の前でジャンプするのを目撃する。「リンゴはまずジャンプしない」「カエルはよくジャンプする」と思っているあなたはきっと驚くだろう。そして「果樹園だからリンゴだろうと思っていたらジャンプした！ということはカエル！？」という具合に予測を変化させることになる。

つまり、観測によってあなたの信念は事前と事後で変わる。ベイズ推論では観測事実によって推論モデルが変化していくのである。

サプライズの最小化

さてこの時、あなたはきっと「驚く」が、このサプライズには２段階ある。
一つ目は「（ジャンプしないと思ってたのに）ジャンプした！」というサプライズ。ジャンプしたことにまず驚く。
二つ目は「（リンゴだと思ってたのに）カエル！？」というサプライズ。これは、「リンゴだろう」という事前の信念を変えざるをえないことに対する驚きだ。こちらはベイズサプライズと呼ばれている。

脳はこれら両方のサプライズを最小化しようと信念を更新する。予測と観測の「ずれ」がなくなるように、言い換えれば辻褄を合わせるために脳は例えば「果樹園にもカエルがいる可能性」を加味して予測モデルを更新するのである。もしかしたら、あくまでリンゴであるという信念は変えずに「誰かがいたずらでリンゴを投げた可能性」を加味したモデルに更新する人もいるかもしれない。事実がどうであれ、大事なのは予測と観測の「ずれ」がなくなることなのだ。

推論としての行為

さて、ここからが能動的推論がベイズ脳理論を発展させた部分である。

これまでは、推論を行うことでサプライズを計算し、サプライズを最小化する能力に基づいてモデルを選択するとどうなるかを考えてきた。しかし、サプライズはモデルに依存するだけではない。データにも依存する。世界に働きかけてデータの生成方法を変え、自己がもつモデルのもとで最もサプライズの小さいデータを選択することによって、モデルを目的に適合させることを保証できる。

『能動的推論』（ミネルヴァ書房）より

サプライズを最小化するために、「知覚」によってすぐに自分の信念を変えるのではなく、何度も見直したり、違う角度から見たり、近づいてみたり、触ってみたり、他人に聞いてみたり、もっとたくさんの証拠を集めることで確かめる、といった「行為」もするよねという話である。

さらに、例えば部屋に入って「暑い！」と感じる時、「この部屋は暑い」と脳のモデルを更新したところで、そもそも生き物として好ましい気温とのギャップは埋まらない。そこであなたは、窓を開けたり、エアコンをつけたり、その部屋から逃げ出したりするだろう。これはもはや、もっとたくさんデータを集めるといった行為を超えた、より能動的な行為といえるが、能動的推論は、こうした生命を維持するための行為（ホメオスタシス）までも説明する。

いずれにしても、この能動的推論が面白いのは、知覚も行為も、予測と観測の「ずれ」の最小化という共通の目的のために協働しているとしている点なのである。

未来の「ずれ」を最小化する

ところで、人間は必ずしも目の前の状況に対して予測と観測のずれを最小化するだけではない。もっと未来のことに対しても計画を立てて実行したり、実際にやってみる前にシミュレーションしたりして考えを変えることもある。
能動的推論はこうした未来に対する人間の振る舞いについても説明することができるという。これは「期待自由エネルギー」と呼ばれている。（それに対して、前述の現在や過去の予測と観測のずれは「変分自由エネルギー」と区別される。）

未来の予測と観測の「ずれ」を最小化するこの期待自由エネルギーのモデルは、事前にリスクや曖昧さを最小化することや、複雑な行動の組み合わせを順序立てて計画することなど、多様な意思決定を説明することができるという。

先ほどの例で言えば、部屋が暑い時に、窓を開けたり、エアコンをつけたり、その部屋から逃げ出したりするのは、現在の予測と観測のずれ（望ましい室温より高かった）の最小化としての行為だが、より長期的な展望を持って未来の予測と観測のずれをあらかじめシミュレーションして最小化しようとすることで、例えば、窓を開けたらもっと暑いかもしれないのでまず確認するとか、エアコンをつけるのは短期的には涼しいが長期的には地球温暖化に繋がるリスクがあるから少し設定温度を高めにするとか、そうした未来に得られるリスクとリターンを考慮しながら多様な意思決定を行うことが可能になるのである。

能動的推論とAI

さて、仮に生き物がこうした能動的推論として知覚や行為をしているとしたら、現在のAIはどこまで近いことができているだろうか。（ちなみに能動的推論も英語でActive Inference、AIである。）

例えばChatGPTのような大規模言語モデルも、膨大な量の事前学習をしたモデルに基づいて会話の次を予測している推論エンジンだが、今のところは人間の会話との「ずれ」を知覚してリアルタイムに信念（モデル）を変えているわけではないし、今のところは画像生成AIも画像を生成はするが、生成された画像との「ずれ」を知覚しているのはあくまで人間の方である。また、身体を持って能動的に世界から情報を集めたり、世界に働きかけて世界を変えるような行為を行うわけでもない。今のところは。

ただ今後、インターネットやスマホがそうであったように、様々な領域にAIが組み込まれていく。その時、人間の能動的推論の中にどのようにAIが関わってくるのか、またAI自体がこうした能動的推論を獲得していくのか、いずれにしてもAIが注目される今だからこそ、改めてこうした人間を含む生き物の行動原理を知ることには意味があると思う。

能動的推論と創造性

ところで、この能動的推論と創造性はどのように関係するのだろうか。最後に、このテーマについてChatGPT（GPT-4）と対話してみたので紹介しよう。

自由エネルギー原理と創造性についてはどんな関係がありますか？

自由エネルギー原理は、生命系がサバイバルと適応を達成するための枠組みを提供します。その核心には、生命系が予測エラーを最小化するという概念があります。すなわち、生命系はその環境を予測し、予測が外れたときにはその予測モデルを修正し、予測エラーを最小化します。これには観察、学習、そして行動が関与します。

創造性について考えるとき、それは新たなアイデアや概念、または新しい視点を生成する能力として理解されます。創造性はしばしば既存の枠組みやパターンからの逸脱を必要とし、未知の領域に進出します。

自由エネルギー原理と創造性の間には興味深い関係があります。自由エネルギー原理の視点から、創造性は新しい予測モデルを生成し、既存の予測と実際の経験との間のギャップを埋める方法として理解されます。創造性が高い生命系は、より多様な状況に適応し、新しい環境に対する予測モデルを開発する能力が高いとも言えます。この観点からは、創造性は生命系の適応能力と直接関連していると言えるでしょう。

そこに能動的推論はどう関係しますか？

能動的推論は自由エネルギー原理を具体化するフレームワークであり、予測モデルのエラー、すなわち、生物の期待と実際の結果との間の差異を最小化するために行動します。

創造性の文脈で能動的推論を考えると、新たな状況や問題が生じたとき、生物は自身の予測モデルを調整し、新しい解決策を創出することで予測エラーを最小化します。つまり、創造性は予測モデルの調整と新しいアイデアの生成という形で能動的推論に組み込まれると考えることができます。

例えば、画家が新しい作品を描くとき、彼は自分が描きたいイメージ（予測）とキャンバス上の実際の絵（観測）との間にギャップがあると感じるかもしれません。彼の創造性が能動的推論に作用して新しい技法を開発し、それにより彼の予測と観測との間のギャップを最小化しようとするでしょう。

予測とのギャップがあることが新たなインスピレーションになることもありえますよね。必ずしも描きたいイメージを実際に描くことだけが創造性ではない気もします。

その通りです。創造性は新しいアイデアや表現、独自の視点を生み出すプロセスであり、これは必ずしも元の予測または目標を達成するためだけに行われるものではありません。

例えば、アーティストが特定のイメージを描こうとするとき、彼が描き始めた初期の予測と最終的な作品との間にギャップが生じることはよくあります。しかし、このギャップ自体が新たなインスピレーションを引き起こし、それが新しい方向性やアイデアを生むきっかけになることもあります。

能動的推論と創造性の関連性を考えるとき、このような予測と結果とのギャップが新しい創造的アウトプットを引き起こす可能性もあると理解することが重要です。つまり、創造性は予測エラーの最小化だけでなく、新たな視点や解釈、そしてそれによって生まれる新しい予測モデルの生成にも寄与します。

新たな視点や解釈によって生まれる新たな予測モデルは予測エラーを最小化するとは限りません。予測エラーを最小化するという自由エネルギー原理と矛盾しませんか？

その点は非常に興味深い観察です。自由エネルギー原理は確かに予測エラーの最小化を中心に据えていますが、それは即座に「予測エラーをゼロにする」ことを意味するものではありません。

新しい視点や解釈によって生まれる新たな予測モデルが当初は予測エラーを増加させるかもしれません。しかし、それは新たな学習の機会を提供し、長期的には生物がより広範な環境や状況に対応する能力を強化することにつながります。

自由エネルギー原理は、生物が自身のモデルを調整し、新しい経験を統合し、より良い予測を行うことで適応性を高めるという観点を提供します。したがって、新しい予測モデルが当初は予測エラーを増加させるかもしれませんが、それが経験の統合と学習を通じて最終的に予測能力の向上につながるとすれば、それは自由エネルギー原理と矛盾しないと考えられます。

重要なのは、予測エラーの最小化という目標が、その達成のプロセスにおいては一時的にエラーを増加させることも容認するという観点です。これは創造性が新しい視点や解釈、そして新しい予測モデルを生む過程において、一時的に不確実性や複雑性を増加させることもあるという事実と並行しています。

とても興味深いです。生成AIのようなテクノロジーが急激に登場した今、予測と観測に大きなギャップが生まれているとも言えます。このギャップは創造性を刺激し、新しい予測モデルの生成に寄与すると同時に、それが最終的な予測エラーの最小化に繋がるかは不確実で、人々に不安や怖れを抱かせます。人々、特にクリエイターはこうした状況にどう対応していくべきだと思いますか？

生成AIのような新たなテクノロジーの台頭は、確かに私たちの予測モデルを大きく変え、新しい形の創造性を刺激します。その一方で、こうした変化は不確実性や恐怖をもたらすことがあります。

まず、これらの変化と直面するときには、開放的で適応的な心構えが重要です。新しいテクノロジーは新しい道具であり、それらを使用して新しいアイデアを探求し、表現する方法を模索することが可能です。テクノロジーが創造性を奪うものではなく、新たな創造性を開花させる手段であると考えることが有益です。

また、新しいテクノロジーについて学ぶことは、予測エラーを最小化し、不確実性や恐怖を軽減する手段ともなります。そのテクノロジーがどのように動作し、どのように使用できるかを理解することで、そのテクノロジーとどのように共存していけるかの予測モデルを改善することができます。

さらに、新たなテクノロジーと共に生きていくことは、個々のクリエイターだけでなく、コミュニティ全体にとっての挑戦でもあります。他のクリエイターや学者、エンジニアなどと協力し、相互に学び合い、支援しあうことが重要です。共有の知識と経験は、個々の予測モデルを補強し、新たな創造的な可能性を開くことができます。

とても面白い議論でした。最後に、以上の議論を踏まえた上で、人間はなぜ創造すると思いますか？

人間が創造する理由は多岐にわたりますが、それは自己表現、新しい視点や解釈の発見、そして理解と学習の欲求から来るものだと考えられます。

まず、創造性は自己表現の一形態であり、個々人が自分自身や自分の経験を表現するための手段です。それは芸術、音楽、文学、科学、技術などの多くの分野で見られます。

また、創造性は新しい視点や解釈を発見し、既知のものを新しい方法で理解する手段でもあります。これは新しい予測モデルを生成し、世界を理解しやすくする助けとなります。

最後に、創造性は新しい知識や技術を学び、それらを統合し、未来の予測を改善する手段でもあります。これは生物が自由エネルギー原理に基づいて、予測エラーを最小化するために行うプロセスと一致します。

したがって、人間が創造する理由は自己表現、新たな視点や解釈の探求、そして予測エラーの最小化という欲求によって動かされていると考えられます。これは人間が自分自身と世界との関係性を探求し、理解し、表現するための基本的な手段です。

大規模言語モデルは推論エンジンでしかないとは言ったものの、ChatGPT（特にGPT4）との会話にはいつも驚かされるばかりである。

【追記】今回のテーマ関連する話題にも触れている雑誌『広告』文化特集に寄稿した記事がnoteでも公開されています。

また、関連イベントとして行なわれた基礎情報学／表象文化論研究者の原島大輔さんとのトークイベントのレポートも併せてぜひご覧ください。

この記事が参加している募集

#AIとやってみた

33,742件

この記事が気に入ったらサポートをしてみませんか？