自然言語、改良した方がよくね?

大きなリンゴとミカンって言われてあなたは何を思い浮かべるだろうか?「大きなリンゴ」と「大きなミカン」を思い浮かべた人もいるだろう。でも、「大きなリンゴ」と「普通のミカン」を思い浮かべた人もいるに違いない。「大きな」がリンゴのみにかかるか、リンゴとミカン両方にかかるかで意味が変わってしまうんだ。こういうふうに自然言語(私たちが普段使っている言語のことで、日本語とか英語とか中国語とかがそれに当たる。プログラム言語やエスペラントみたいな人工言語と対比される。)はしばしば複数の解釈を読み手に与えてしまうんだ。

自分は複数の解釈が生じないように普段からできるだけ表現を工夫している。例えば、「大きなリンゴ」と「普通のミカン」を表したいなら、「ミカンと大きなリンゴ」って言う。「大きなリンゴとミカン」だと上に挙げた2つの解釈が可能になってしまう。

でも自然言語だと絶対に誤解が生じないような文構造を作るのには限界があるんよな。例えば「イチローのように諦めない人間」は「イチロー=諦めない人間」とする解釈と「イチロー=諦める人間」とする解釈の2通りに解釈できてしまう。これの代替となる表現は思いつかない。 「イチローは諦めない人間であるが、それと同じような人間」などと表現することもできるけど、あまりにも回りくどくなってしまう。

だから、自然言語、改良するべきじゃね???って思ったってわけ。

人間は書き手が絶対に解釈が一つにしかならない文章を無理に作るのではなく、読み手が文脈や常識や妥当性からの推測で確率の高い解釈を選んでるわけだ(例えばイチローの例ならイチローがどういう人間かを知っているから「イチロー=諦めない人間」とする解釈の方を選べる)。

でも外れることもある。その理由は、
1、確率でしかないから
2、知能があまり高くなくて文脈や妥当性からの判断ができない人や、知識がなくて判断ができない人がいるから
3、文脈、常識、妥当性を使っても判断できない場合があるから(例えば前に挙げた「大きなリンゴとミカン」の解釈)

それでも自然言語で複数の解釈が可能な文構造が許容されてしまうのはそれによる不便性を効率性が上回るからなんだろうか。 厳密に表現しようとすると確かに正確に伝わる可能性はあがるけど文章が冗長になって伝達効率は落ちる。

自然言語にはメリットもデメリットもあるので、自然言語をそのまま使うべきかに関しては状況による場合分けが必要だな。日常会話かそれ以外で議論を分ける必要がある。
【日常会話】
効率性(気楽さ)を重視して自然言語そのままでいいと思う。ただ、読点の使い方に気をつけるみたいな最低限の努力はすべき。「大きなリンゴとミカン」みたいな、他の情報からも判断できないものに関しては、少々めんどくさいがていねいに説明してもよさそう。
【日常会話以外】
法律とか公文書とか論文みたいな客観性、厳密性が求められるものには自然言語を誤解が生じないように改良したものが必要かも。もちろんその際も情報伝達効率は考えた方がよいのは間違いない。プログラム言語みたいに階層構造をわかりやすくするのがよさそう。
例)
「大きなリンゴ」と「大きなミカン」を表したいなら、
大きな
 リンゴ
 と
 ミカン
ただし、これでは対応できない例もある。「イチローのように諦めない人間」はその一つ。こういうのに対応するためには、すべての単語or節(主語と目的語を含む単語の意味的なかたまり)がどの範囲の単語にかかるかを明示してやるという方法をとらないといけない。
こんな方法はどうだろうか。
・修飾語を<>で表し、被修飾語を[]で表す
・修飾語、被修飾語のペアが複数存在する場合は、各ペアの前カッコの直後、後ろカッコの直前に番号をつけて区別する
例)<②<①イチローのように①>[①諦めない①]②>[②人間②]
これで解釈は一通りになったはず。だいぶ読むのめんどくさいけど。まだ少数の例しか試していないので、サンプルを増やしてどんな文にも有効なのか検証する必要はある。

余談だけど、人間は複数の解釈が生まれやすい自然言語を「周辺情報から推測して確率の高い解釈を選ぶ」っていう手法で読み解いてるので、chatGPTが取った「前の会話につながる可能性の高い単語をつむいでいく」っていうアプローチは正解だったんだろうなって思った。


この記事が気に入ったらサポートをしてみませんか?