見出し画像

20040501 言葉の距離

 シソーラスの距離という考え方があるらしい。シソーラス$${^{*1}}$$とは語句を意味によって分類配列した語彙集、もしくは類義語集$${^{*2}}$$のことである。シソーラスの語源は英語だ。

 「シソーラスの距離」即ち「語彙集の距離」とは一体どういうことなのか。数学的に距離というと、二点のそれぞれの座標の各要素の差を自乗して、それらの和の平方根だったり、もっと拡張すればある関数又は写像である性質を持てばそれを「距離」$${^{*3}}$$と表現したりする。シソーラスの距離とは言葉の「意味の近さ$${^{*4}}$$」のようだ。

 ある二つの単語が同義語であれば「近く」、関連しているだけであれば「遠く」なる。例えば「雑記」であれば「メモ」は殆ど同義語なので距離が近い。「随筆」だと少し遠くなり、「伝記」となれば書き物として関連はしているもののかなり距離があると感じられる。「雑記」と「雑草」とでは関連も何もないので距離は無限大になる。

 ある単語に対する距離を記載した語彙集があればある単語と単語との距離が測れるようになる。ある単語の語彙集に距離を測る相手の単語が載っていなければ、関連性のない単語なので自動的に距離が無限大になる。

 こういった単語の意味の距離を測れば日本語の構文を自動的に的確に解析できるようになるらしい。解説のページでは「望遠鏡で泳いでいる彼女を見た」という例文を挙げている。「望遠鏡で」は、「泳いでいる」と「見た」とに文法的には係る可能性があるが、意味の距離からすれば「望遠鏡」と「泳ぐ」とは距離が無限大になってしまうので「見る」にしか係らないと結論付けることができる。今までは単語の文中の位置そのものから読み取る方法が取られていたらしい。関連する言葉は互いに近くに配置するのが普通の文章の組み立て方だからである。

 それでは「ロケットで木星を周回する衛星に飛び立つ」という文はどうだろう。「ロケットで」が「周回する」と「飛び立つ」とどちらでも係る可能性がある。しかもどちらもロケットに関連している単語である。しかし「ロケットで周回する衛星」などあるわけないので、「ロケットで」は「飛び立つ」に係るしかない。

 文学的表現の都合で、係る言葉が離れてしまうことがあるかも知れないが、やはり普通は直近に配置すべきだろう。最初の例であれば「泳いでいる彼女を望遠鏡で見た」だろうし、次の例は「木星を周回する衛星にロケットで飛び立つ」と書くのが普通である。

*1 国語辞典 英和辞典 和英辞典 - goo 辞書
*2 20030831 類語辞典
*3 距離空間とコンパクト性
*4 シソーラスで語と語との意味的な距離を測る

この記事が気に入ったらサポートをしてみませんか?