「記号設置問題」のその先へ

2024年2月16日 14:31

はじめに

この記事では、認知科学の本である「心を知るための人工知能」の内容をベースに、今まで他に読んだ本やインターネットの情報と合わせて「記号設置問題」について考えます。基本的な流れとして、初めに「記号設置問題」について言語学の観点を導入し深く考え、それを基に「記号設置問題」から「記号創発システム」へと議論を発展します。そして最後に、ChatGPTで有名なLLMを、「記号創発システム」の観点から分析し今後のAIの進化について考えます。

記号設置問題

記号設置問題とは、AIが真に概念を理解していないことを指摘した問題です。ここでは簡単のために、記号のことを自然言語と考えます。AIが概念を理解する、すなわち自然言語の単語の意味を理解することは「身体性」という観点からとても難しいことです。AIに単語の意味を教える時、どのように教えれば良いのでしょうか。辞書を丸々記憶させることを考えると、AIが学習した単語は辞書によって他の単語を使って説明されます。その単語もまた他の単語によって説明されます。これでは、単語の理解は辞書の中から出ることはなく、真にAIが単語の意味を理解することはないのです。「甘い」と言う単語の真の理解は、他の単語によって説明されることでは得られず(記号が設置しない)、「身体性」を持った経験によってしか得られないと考えるのが「記号設置問題」です。

「記号」とは

「記号設置問題」では、記号とその意味が一対一に結びついていることを前提に議論を進めますが、果たしてその前提は正しいのでしょうか。勉強が苦手なときに聞く「テスト」と勉強が得意になってから聞く「テスト」の意味するものは異なることから、この前提には違和感があります。
記号について深く考える際、パースの三項関係というものがあります。パースの記号学では、図のように記号を表象(Representamen)、対象(Object)、解釈項(Interpretant)の三項によってとらえます。例えば図のように表像として「りんご」という言葉がある際、これを脳（解釈項）がすでに知っている知識をもとに「赤くて甘い果物であるりんご」を対象として想起するといった形です。表像として当てはまるものは言語以外の他のモーダルでも当てはまり、「りんごの匂い」などが表像となることもあるでしょう。この三項関係においてポイントとなるのは、解釈項の存在です。ただ、単に表像と対象が一対一に結びついているのではなく、解釈を行う脳のそれまでの経験などによって解釈のされ方が動的に変化することが重要なのです。

言語の離散性

ここで興味深い言語学の考え方で、言語はのっぺりとした世界に対して単語というものを通して枠組みを作ることで、離散的な表現を可能にしているという考え方があります。例として、色彩語について考えます。物理的に色とは光の波の波長のことであり、人間がそれに対してここからここまでは何色であるとラベル付けをしています。これが言語における離散性であり、単語の意味する波長の範囲を何色というラベルで枠組みを作っているのです。
ここで一つの疑問が生まれます。濃い青と薄い紫の違いはどこからなのでしょうか。パースの三項関係で考えると、表像としては「光の波長情報」があり、これを解釈項で解釈した上で対象としての「⚪色」と判断していると言えます。ということは、解釈項が生得的なものでなく、発達過程によって生成されるものだと考えると、人によって解釈項が異なるために同じ色をみても違う色だと判断するかもしれません。しかし、基本的に人は大体同じような色の感覚を共有しています。これは、後述する記号創発システムによって理解することができます。

ガヴァガーイ問題

ガヴァガーイ問題は言語学における問題の一つで、単語の意味するものの範囲を定めることの難しさを示す問題です。森の奥地に住んでいる原住民の人が飛び跳ねていうウサギを見て「ガヴァガーイ」と叫んだとする時、「ガヴァガーイ」が意味するものを特定することは簡単ではありません。単に「ウサギ」という生物のことを指しているのか、もしかしたら「小動物」のことを指しているのかもしれません。実は、「飛び跳ねる動作」に対してガヴァガーイと言ったのかもしれません。このように、単語と視覚情報だけが与えられても単語の意味するものの範囲を定めることは難しいのです。では、人間はどのように単語の意味を学習していくのでしょうか。これについては、後述の人の言語習得によって理解することができます。

人の言語習得

人はみな生まれた国で使われている言語を自然と習得し使えるようになります。ごく当たり前のことですが、この言語習得の過程はとても複雑で難しいものです。それを理解するため、ここでは人が単語の意味を知ることについて考えます。問題になるのは連続した波である音声から単語の意味するところを切り出す作業の難しさと切り出した単語に対してそれの指す意味の範囲を決めることです。感のいい人は気づいているかもしれないですが、後者について、先に述べたパースの三角項とガヴァガーイ問題が深く関係してきます。表像である単語が、その意味する範囲である対象へと変換される際に解釈項(脳)によって変換されるのです。そして、その解釈項が学習することでガヴァガーイ問題は解かれるのです。この学習は、統計的になされるといわれています。耳からの単語情報と、目からの視覚情報が統計的に分析され、この単語を聞いたときはこれが見えていたことが多いというようなことから学習が進むのだそうです。この過程について記述するためには、より深い認知科学への知見が必要であり、今の自分には難しいためここまでに留めます。興味のある方は、共に認知科学の沼にはまりましょう。
ここで、強調したいのは人は生活している中で解釈項(脳)が変化し続けているという事です。このことは、記号創発システムについて考える際重要な特性になります。

記号創発システム

ここまでで「記号創発システム」について説明するためのパーツを揃えてきました。ここからは、そのパーツを使って「記号創発システム」とは何たるかを理解していきます。
「記号設置問題」では「記号」をある意味で固定的なものであると考えるが、「記号創発システム」では個人と社会の二つの要素の相互作用によって「記号」は維持、変化されるものであると考える。人の言語発達では、個人によって「記号」の解釈が動的に変化することを記述しました。では二つ目の要素の社会とはなんでしょうか。これについて、言語の離散性に話を戻します。人によって解釈項が異なるために同じ色をみても違う色だと判断するかもしれませんが、基本的に人は大体同じような色の感覚を共有しています。これは一体なぜなのでしょうか。これに対する解として、個人の解釈項は集団の中で使われている「記号」の使われ方に影響すると考えます。これは、新しい単語が発生する時について考えると直感的に理解することができます。
「記号創発システム」では、個人と社会の二つの要素がお互いに影響を与えながら、全体として動的に「記号」が維持、変化されていると考えるのです。

「記号設置問題」から「記号創発システム」へ

「記号設置問題」では、「記号」とその意味が一対一に結びついていることを前提に議論を始めました。そのため、「記号創発システム」について考えるとそもそも「記号」は個人と社会によって動的に変化するものであり、「記号設置問題」は最初から存在していなかったという結論になるのです。実は、この考え方は先端のAI開発では既に実際の研究に生かされているといえます。次の章ではそれについて言及します。

AI研究と「記号創発システム」

この章は、この記事のまとめとして、僕が断片的に色んな所から学んだ知識からこう言えるのではないかと想像した内容になります。間違ってる内容があればコメントにて優しく指摘いただけると喜びます。
「記号創発システム」をコンピュータ上で実現することは、「記号」が表すものが幅を持ち、さらに文脈などによってその領域が変化する特性を持つ必要があります。これを実現する技術として、確率分布を用いた生成モデルが有効なアプローチになるのだと思います。確率分布で「記号」の意味の領域を表現し、確率分布のパラメータがまた確率分布によって出力されるものであると考えることで、文脈によって変化する領域を表現していると言えると思います。この生成モデルは現在最も知能を実現していると言えるChatGPTなどのLLM技術の基盤です。このように考えると、知能を実現した強いAIはもうすぐ実現できそうに感じます。しかし、僕はAIが「記号創発システム」を実装するには決定的な欠点が一つあると考えます。それは学習時に実世界との相互作用がない点です。LLMの学習では、インターネットから収集されクリーニングされたデータが用いられます。対して人間の発達過程では、受動的な感覚器からの情報はもちろん、主体的な探索のフィードバックによる情報を用い学習しています。この学習をコンピュータで実現するためには、ロボットによる身体性の獲得が最もイメージしやすく、実際にそんな研究も数多くあるので今後の発展をAIオタク＆アプリケーションデベロッパーとしては、常にキャッチアップし続けたいと考えます。

参考文献

本「心を知るための人工知能」
本「言語の本質」
インターネット「生成AI技術の解説」

この記事が気に入ったらサポートをしてみませんか？