自然言語処理AIと哲学的意味論の関係
先日次田瞬さんの『意味がわかるAI入門』という本を読んだ。この本は、言葉の意味およびその理解に深い関心を持つ若手哲学者によるAI解説書である。私自身は最近のAIに関する本をほとんど読んでいないレベルの読者だが、本書前半のAI研究史の解説は要点を押さえ分かりやすく有益だった。そもそも「言語モデル」という言葉の意味(※wikipediaにも書いてある)も本書で初めて知った。また本書によると、言語モデル的仕組みに対してピンカーが『言語を生みだす本能』(1994)で指摘していた問題点が、LLMに先立つRNN(リカレントニューラルネットワーク)という技術でかなり克服されているそうで、このあたりの解説は自分には目新しく興味深かった。
しかし本書後半の「AIは言葉の意味を理解するのかという問題を言語哲学の観点から掘り下げる」という趣旨の第二章の内容については、面白いのだが根本的に同意できない点があるのでコメントしたい。
まず著者によると、言葉の意味については二つの代表的なアプローチがある。一つは「真理条件意味論」で、これは哲学者に人気が高い。その理由は、合成原理や思考の体系性というような言語的意味の重要な特徴を捉え説明できる点にある。もう一つは「意味の使用説」で、現在のAI技術(ニューラル言語モデル)はその一種である「分布意味論」を作業仮説にして生み出されたそうである。
真理条件意味論については、それが言語の意味全てをカバーするとは著者も含め誰も言っていない。例えば著者は「そもそも真理条件意味論の研究者は個々の単語が実際にどんな意味を持つのかに興味がない」と言っている。そういったこと自体は、意味研究が様々な学問分野で分担して行われるという当然の事に過ぎない。一方意味研究の中で真理条件意味論が重要な部分を担当していることも事実である。具体的には合成原理が適用可能な部分であり、(個別の単語の意味を前提した上での)項充足・修飾・ラムダ抽象(関係節)等の組み合わせ構造、論理語や量化子などである。真理条件意味論の原型はフレーゲおよび前期ウィトゲンシュタインにあり、野矢茂樹さんの『言語哲学がはじまる』などで知ることができる。
著者は真理条件意味論に対しては、現実の自然言語に適用するには非力だが理念的にはもっともらしいと評価し、一方分布意味論に対しては、合成原理など意味に対する伝統的理念を十分に尊重できていないと批判している。しかしその批判を含む第二章5-2の著者の主張は大きく間違っていると思う。
第二章5-2での著者の主張を以下に書く。
自然言語処理および分布意味論の立場では、単語に関して、周縁的偶然的事実や偏見などであっても、それが現実の言語使用に影響反映している限り、意味(=単語ベクトル)の一部であり構成要素になる。
しかし著者の考えによると、例えば固有名「ローマ」に関して、それがイタリアの首都であることは、単なる地理的事実情報であって意味の一部ではない。なぜなら、ローマがイタリアの首都でない可能世界の想像はいくらでも可能かつ有意味だからである。もしも首都であることが意味の一部なら、「ローマ」の意味はそれが首都でなくなった瞬間に変化してしまう。それだと国名や都市名の意味はあまりにも不安定である。
別の例を挙げると、外科医と聞いて男性を連想してしまう人は多いが、そのような連想は単なる偏見であり、「外科医」の意味の一部ではない。「女性の外科医」にどんな偏見が結びついていようが、意味は「女性」「外科医」それぞれの意味から合成原理で計算可能でなければならない。
著者によれば、自然言語処理の単語ベクトルは意味そのものを捉えているわけではない。それは単語が表すものに関して人々が抱いている通念の簡潔な表現に過ぎない。
言葉の「意味」についての著者の上記の主張および分布意味論批判については、多分賛否が分かれると思う。普通に考えると、イタリアの首都であることは「ローマ」の理解を構成する重要な一部だろう。しかし著者はこれを否定し、首都でなくなること含め反実仮想の中でも安定した意味を保持するため、「ローマ」の意味は指示対象つまりローマそのものであるという、クリプキ的直接指示説?を主張する。
しかしそもそも言葉に必然的に結びついた「意味」と、偶然的にしか結びつかない事実情報との間に、境界線は引けないというのが、クワインの最もよく知られた教訓で、現在の分析哲学では常識扱いされていたと思う。著者もそれは知っているはずなので、たとえ厳密でない「程度の問題」ではあっても相対的区別は必要という考え方と推測される。
例えば、平均的に高所得であることは「医師」の意味に含まれるか?医師が代表的な難関国家資格であることについてはどうか?たとえそれらの事実が単語「医師」の現実の日本中の言語使用に反映しているとしても、意味の一部とまでは言えない。というのが多数意見だろう(医師が皆貧乏な可能世界も普通に思考可能である?)。実際このような事例なら、著者を支持する人がかなり増えそうである。
しかしやはり、著者の方が間違っていると言いたい。
著者の主張に沿って考えるなら「医師」の意味は何なのか。「医師の集合」のような無内容な答えでないとすれば、「病気を治してくれる人」のような、子供や昔の人にも通用するような比較的普遍的な意味内容になるはずである。しかし、ではそもそも病気とは何なのか。健康、あるいは体の正常な状態とは何を意味するのか。このように、基本的な言葉であるほど、意味は現実世界に深く埋め込まれ、事実知識から分離困難である。「ローマ」についても同様で、個人ごとに大きく異なりうるような知識を利用して、かつ対話相手に合わせた言葉使用によってローマに関する有益な情報交換ができること、それが意味理解の内実であり、それは首都でなくなることぐらいでびくともしないと思う。
ただし、「ローマ」という単語による情報交換およびその情報利用が、大きな混乱もなく長年無数に行われてきた事実を裏で支えているのはローマそのものであり、その点では意味の直接指示説も正しい。医師にせよローマにせよ、長い歴史を持つ言葉の意味は現実の事実連関から分離不可能である。
ちなみに分布意味論を「意味の使用説の一種」とする著者の整理もあまり賛成できない。個人的には、意味の使用説のポイントは、言語使用を具体的目的を持った行為として見ることにあると思っている。その使用は、聞き手の行為を導く・共同作業の準備をする・推論の前提にするなど様々な目的を持ちうる。いずれにせよ「言葉の意味とは使用である」等という、どうにでも取れそうな定義ではいかにも大雑把過ぎる。そして分布意味論は、私が重要と考えている先述の意味での「意味の使用説」とは全く別物である。