見出し画像

辞書の見出しは何形?

この記事は、松浦年男さんが企画した言語学な人々の第二弾、言語學なるひと〴〵に参加しています。松浦さん、黒木さん、ありがとうございます!

以下に挙げる方々に、辞書や言語のことについて教えていただきました。改めてお礼を申し上げます。
小川潤さん(ラテン語、古典ギリシャ語)、黒木邦彦さん(朝鮮語)、吉村大樹さん(トルコ語、オスマン語)、村田英璃さん(チェコ語)、ありがとうございました!

引けない辞書


Hamjambo. Ninaitwa Kanji. Na wewe je?
「みなさんこんにちは。私の名前は幹治です。あなたは?」

最近スワヒリ語を勉強しているのでスワヒリ語であいさつしてみました。スワヒリ語を含むバントゥー系の言語といえば、動詞・名詞・形容詞に義務的に接頭辞がつくことで有名です。上のスワヒリ文で「私の名前は〜」に当たるのはNinaitwaという部分で、これはni-na-it-w-a 一人称単数-現在-呼ぶ-受動-最終母音「私は呼ばれている」と分析できます。この語形の具体的な意味を担っている部分(=語根)は -it- です。日本語のように語根が頭に来る言語とは異なり、語根が語の真ん中に来ています。

このように文法的要素として接頭辞がつく言語を勉強する時に困るのは、頭の文法要素を取り去らないと辞書で当該項目にたどり着けないということです。日本語の辞書で「食べさせられなかった」のような項目が単独で立項されておらず、「食べる」を探さないといけないのと同じく、スワヒリ語辞書も「ninaitwa」では立項されておらず、「-ita」を探さなければなりません。

この問題は、日本で初めてスワヒリ語辞典が編まれようとしていた時から人を悩ませていました。千野栄一編『日本の名随筆 別巻93 言語』(作品社、1998)という、言語に関する様々なエッセイを集めた本があります。『ビールと古本のプラハ』の千野先生は当然のこと、中川裕先生(グイ語)や中川裕先生(アイヌ語)の随筆も楽しめます。この中に、日本で始めてスワヒリ語辞典を編集した西江雅之先生による「引けない辞書」という作品が収められています。僭越ながら乱暴に要約すると、スワヒリ語のように接頭辞が義務的に用いられる言語では辞書を作るのが難しいので困った、ということです。語幹形を立項すれば学習者にとって使いにくいし、かといって人称や時制の接辞がついた屈折形を全て立項するには紙幅が何ページあっても足りませんし、仮にni-という接頭辞が付いた形で立項すると、辞書の【n】の箇所に動詞が集中してしまい、検索性が損なわれます。

引けるけど、どっち?な辞書

スワヒリ語のような接頭辞型の言語だけでなく、接尾辞型の言語でも困ることがあります。私がフィールドワークを行っている徳之島伊仙町面縄(おもなわ)の方言は、日本語と同じ接尾辞型の言語です。

「食べる」    kam-i
「食べる」    kam-jur-n
「食べさせる」  kam-as-jur-n
「食べさせられる」kam-as-ar-jur-n

というように、語根 kam- に対して接尾辞がたくさん付いていきます。

面縄方言には、文を終止できる形が2つあります。上に挙げた例の最初の二つがそれにあたります。kami という形は、文終止はできるが連体修飾機能をもたず、代わりに名詞としてはたらいたり助動詞に接続されたりするので、日本語でいうと終止形+連用形のような機能を持っていると言えます。kamjun という形は文終止に加えて名詞修飾の機能をもつので、文中の働きは日本語の終止形とほぼ同一といえます。困るのは、どちらを辞書の見出しにするべきかということです。日本語の辞書では終止形を見出しにするというのが当たり前になっていますが、面縄方言では文を終止する形が2つあり、どちらの形式も適格に思えます。

面縄方言のネイティブスピーカーに「『食べる』は面縄方言でなんといいますか?」と聞くと、概ね 終止/連用形(kamiの形)が一番最初に返ってきます。また、「辞書の見出し語にするとしたらkamiとkamjunのどちらがいいですか?」と聞くと、kamiのほうがよいといいます。どうやら、ネイティブスピーカーの直感では、複数の文終止形の中にも「代表的」だと感じられる形があるようです。

長々とまえがきを述べたので、そろそろ本題に入ります。世界の言語の中でも、日本語のように辞書の見出し語が一義的に決まっていて検索にも作成にも支障があまりなさそうな言語、スワヒリ語のように検索にも作成にも困難がある言語、徳之島の方言のように検索には問題がないが作成の際に迷うような言語があることがわかりました。そこで、この記事では、

  1. 世界の言語の辞書の見出し語にはどのようなバリエーションがあるのか。それらは言語の特徴とどう関連するのか。

  2. 一つの語根が複数の語形を持つ時、見出し語としてどれを選択するのか

について検証してみようと思います。

…と威勢のいい問いを立ててみたものの、知らない言語の辞書を調べるというのは途轍もなく骨が折れる作業であることがわかったので、対象の言語を東京外国語大学に専攻課のある27言語+αにしぼることにした…のだけど、それすらもかなり時間がかかってしまい、結局以下の言語だけを調べました。

日本語、奄美語、国頭語、沖縄語、宮古語、八重山語、与那国語、アイヌ語、朝鮮語、中国語、満洲語、シベ語、モンゴル語、タガログ語、ウズベク語、トルコ語、オスマン語、古典ラテン語、中世ラテン語、スペイン語、ポルトガル語、フランス語、イタリア語、英語、ドイツ語、オランダ語、ロシア語、ポーランド語、チェコ語、古典ギリシャ語、ウルドゥー語、スワヒリ語、テンボ語、フンデ語、リンガラ語、Mwenyi語、アラビア語
計27言語、計167冊

語族が日琉・印欧・バントゥーに偏りまくっていますが、ご勘弁ください。また、語形の形態統語論的な解釈、表記、文献の選定、用語などに関して初歩的な誤りを含む可能性があるので、指摘していただけると幸いです。
でも、全然知らない言語の辞書を167冊も引いてまとめた努力は認めてくれ!

まとめた結果

調査結果をスプレッドシートにまとめました(結構抜けがありますが、今年度中には埋めたいです)。
全ての言語で「食べる」という動詞を検索しました。なぜなら、私は食べるのが好きだからです(そして、ほとんどの言語で固有語の規則動詞がありそうだったからです)。
そして、この企画とは直接関係ありませんが、やはり系統的に近い言語は音形が似ていて面白いです。

スプレッドシートだけ見てもよくわからないので、要点をまとめます。まず、「世界の言語の辞書の見出し語にはどのようなバリエーションがあるのか。それらは言語の特徴とどう関連するのか。」という第一の疑問に対する回答です。

①見出し語と言語類型の関連

ここでは、言語類型として、語形変化が語のどこで行われるか(頭、中、尾)に注目して見てみたいと思います。

①-1 接尾辞型(接辞が添加されるかどうかに関わらず、お尻の方が変化する言語を「接尾辞型」と呼びます。以下同様。)

日本語朝鮮語ラテン語ドイツ語のように語尾が変化する言語では、語として成立する(=文中にそのまま現れる)形式が見出し語になっていることがほとんどでした。辞書の「頭から検索する」という性質上、語尾に何が現れようが検索性が損なわれにくいため、どうせなら語尾も示しておこう、ということになるでしょう。このタイプの言語では動詞を代表する形式の語尾が固定されていることが多いため(朝: -다, 羅: -ō, 独: -en)、語尾を見れば品詞が特定できるという利点もあります。文字数の経済性を考えれば語幹ないし語根だけを提示する方がよいですが、日本語母語話者としては語幹だけ示されてもあまりしっくりこない感じがあります(kak- だけ提示されても「書く」がすぐ想起できないですよね?)。日本語の場合、書記体系として表音節文字を採用しているために表記の上で語幹と語尾に分離できず、語全体を出さなければならないという事情もあるのでしょう。

接尾辞型言語の辞書で例外的だったのは、語幹のみを示していたモンゴル語(現代蒙英日辞典; Mongolian-English Dictionary)とウズベク語(Uzbek-English Dictionary (Dunwoody Press); Uzbek-English Dictionary (OUP))です。ただし、両言語とも、語形をフルで示していた辞書(現代モンゴル語辞典、簡明ウズベク語辞典など)もありました。というかそれが多数派。なぜこの2言語にだけ語幹を見出し語にする辞書があったのか、門外漢なので全くわかりません。辞書編纂の慣習などが関係しているんでしょうか?誰か教えてください。

①-2 接辞添加の方向(接頭辞型)

次は、問題の接頭辞型言語です。このタイプは、調査言語が偏りすぎていることもあって、冒頭に挙げたバントゥー系言語以外には、語幹の前に名詞を抱合したり人称接辞が付いたりするアイヌ語だけです。もっと調査したいですね。

さて、西江先生の「引けない辞書」に対する回答です。スワヒリ語の辞書は、調査した12冊の辞書の全てが語幹(語根-最終母音)を見出し語としていました。やはり、頭に人称接辞をいちいち付けていては話にならないということでしょう。ただし、pig-i-a (語根-派生-最終母音) のように語根の後ろに派生接辞が付いた形(適応形、使役形など)は、多くの辞書で見出し語として立項されていました。このことからも、語彙情報を中心的に担う語根の後ろに何かが来るのはOKだけども接頭辞が来るのはまかりならぬという強い制約を感じます。

フンデ語・リンガラ語・Mwenyi語などのバントゥー諸語は、接頭辞型の言語であるにもかかわらず語幹ではなく不定形(kV- で始まる形)を見出し語としています。それは、これらの辞書が意味領域順の排列(=頭の音に沿って排列されていないため、音による検索性を考慮する必要がなく、むしろ頭にkV-がついていると動詞だと分かりやすい)だからといえるでしょう。

今回の企画に唯一の抱合型言語として参戦したアイヌ語はどうでしょうか。アイヌ語は3冊しか調べられなかったのですが、全ての辞書で、
・動詞語幹(=文中にそのまま出られる形)は必ず立項する
・動詞語幹の前に他の要素が抱合した形もある程度は収録する(→語頭に語彙的要素が来るのはある程度OK)
・人称接辞は付けない
という方針を取っているようでした。抱合することで理論上無限に語形を作れそうですが、そのうち頻度が高いもの、ある程度固定化しているものを立項しているようです。ただし、やはりスワヒリ語と同じように、語頭に文法的要素が来るのは許さないという方針です。

①-3 接中辞型

接中辞型の言語は、アラビア語タガログ語です(アラビア語って「接中辞型」でいいんですか?詳しい人、教えてください)。
これらの言語の辞書は、以下の二つのタイプに分類されます。
(1)見出し語 = 語根型
(2)見出し語 = 語形型

(1)の見出し語 = 語根型 では、全ての見出し語は語根です。テキスト中に現れる単語から全ての接辞を取り去らないと辞書が引けないため、語形中のどこが接辞でどこが語根なのか見分ける必要があります。このあたりの難しさについては、長屋尚典「タガログ語 (フィリピン語) の辞書の引き方」に詳しいです。私はこのタイプの言語を学習したことがありませんが、早々に挫折しそうです。
(2)の見出し語 = 語形型では、文中に出現する語形がそのまま掲載されています。とはいってもやはり紙幅に限りはあるので、見出し語として立項されるのはある程度頻出するものに限られるようです。
概ね、(1) は中級者〜ネイティブ向け、(2) は初学者向け、というターゲット設定がなされているようでした。

ここまでのまとめ

語形変化が語中のどこで行われるか(頭、中、尾)によって、見出し語形の選好性が異なるということが分かりました

②複数の選択肢からどのように見出しを選ぶか

徳之島面縄方言では、kamjunとkamiという二つの終止形式のうち終止連用形のkamiが選好されるということを上述しました。他の言語ではどうでしょうか?「どの形式を選択するか」という問いを検証するので、語根/語幹を見出し形とする辞書はここでは無視することにします。

以降、古典的な形態論的分類(膠着語、屈折語)ごとに見てみたいと思います。孤立語、抱合語は今回ほとんど調べられていないので飛ばします。

②-1 膠着語

膠着語は語幹に対して接辞をくっつけていく言語で、それぞれの形態素の分かれ目がある程度はっきりしているのが特徴です。今回調べた中では日琉諸語朝鮮語モンゴル語満洲語テュルク諸語バントゥー諸語などがこれにあたります。見出し形には多くのバリエーションが見られました。

②-1-1 文終止ができる(=主節の述部になる)が、名詞修飾ができない形式(終止形)を選ぶ言語
奄美語、国頭語、沖縄語、宮古語、八重山語、満洲語、シベ語

②-1-2 文終止も名詞修飾もできる形式(終止・連体形)を選ぶ言語
日本語、奄美語、国頭語、モンゴル語

②-1-3 引用節の述部になる形式(朝鮮語: 基本形)を選ぶ言語
朝鮮語

②-1-4 不定形を選ぶ言語
フンデ語、リンガラ語、Mwenyi語

(②-1-5 様々な形が立項されている辞書)
おもろ語(混効験集)

調査した中で揺れがあるのは、奄美語と国頭語だけということになります(おもろ語は一つの辞書の中で揺れているので除外)。そもそもこの中で終止形と終止連体形の区別があるのが奄美語・国頭語・モンゴル語だけ(ですよね?)なので、終止できる形が選ばれるという原則を仮定すれば、揺れが生じうるのもその三言語に限定されそうです(沖縄語などの焦点呼応形 -ru も一応文終止できますが、ここでは除外します)。終止形があるのにあえて終止連体形(形動詞)を選ぶという点で、奄美語・国頭語とモンゴル語はなぜか似ています。なぜでしょうか。モンゴル語勉強してみようかな。

ここから何かを一般化することは難しそうですが、あえていうならば、

・文終止ができる形でも、過去形・命令形・疑問形、係り結び呼応形などは選ばれない(非過去の直説法(より無標な形)が選ばれる)。
・文終止ができない形は選ばれない(副動詞形、純粋な連体形など)
・文終止しかできない形式と文終止・連体修飾が出来る形式の両方をもつ言語は、連体形を見出し語として選ぶ傾向にある。

くらいでしょうか。

②-2 屈折語

屈折語というか、実質インドヨーロッパ語族のまとめです。これはかなりわかりやすく、以下のような原則です。

不定形がある接尾辞型の言語は、不定形を選択する。

より無標な形を選択するという意味では、膠着語の「非過去の直説法が選ばれる」という原則と通じています。

例外として、古典ギリシャ語古典ラテン語が挙げられます(これらと並びたつサンスクリット語は語幹が見出し語になるそうです。本当はサンスクリットも調べられればよかったですが…)。現代語勢が不定形を選択するなか、これらの言語は頑なに一人称単数現在形を見出し語としています。どうして古典語は屈折した形を選びたがるのでしょうか?今回参照した古典語の辞書は全て18世紀以降に編纂されたものなので、編纂者がすごく昔の人だったから、というわけではなさそうです。何か、古代の人々が考えていた原則のようなものがあって、それが受け継がれているのでしょうか?中世ラテン語の辞書は不定形を見出し語としているものが多いようです。

残念ながら私の技術的限界により古代に編纂された辞書にあたることはできなかったのですが(知ってる人いたら教えてください)、入手できた文献から、古代の文法家がどのように考えていたのか推測してみたいと思います。ローマの文法研究者マルクス・テレンティウス・ウァッロ Marcus Terentius Vallo (BC116-BC27)は、著作 De Lingua Latina(ラテン語について)の中で、ラテン語の語は名詞・動詞・不変化詞・分詞の4つに分類できると述べた上で、動詞の代表的な例を以下のように挙げています。

[...] quae habet tempora [...] dicendi ut scribo et lego [..]
筆者訳:「時制を持つ語類...すなわちscriboやlego...」

M. T. Varro (1958) On the Latin language : in two volumes / with an English translation by Roland G. Kent. Rev. ed, Harvard University Press, p.404

ラテン語動詞のoで終わる形は一人称単数現在形(辞書の見出し形)です。このように、文中で動詞の語形を例示する際に一人称単数現在形を出していることから、ローマ人も一人称単数現在形が基本の形だと思っていたのではないかと推測します(でも、明示的に言われているわけではないので、反例はたくさん見つかりそうです)。

一応、ラテン語辞書にも不定形を見出し語としているものが一冊ありました。羅-蘭辞書の Standaard woordenboek Latijn-Nederlands です。まえがきを読むに、この辞書は初心者向けに書かれた辞書のようです。そういえば、私もラテン語の教科書の巻末語彙集で不定形を見出し語にしたものを見たことがあるような気がします。教育用途の辞書だと不定形を選択するものがあるのかもしれません。

②-3 Web上の辞典

今までどうこう言ってきましたが、Web上の辞典にはそんなものは一切関係ありません。紙幅の都合がないので、サーバー代さえ払っていれば何万、何億語でも収録することができます。代表的なのはWiktionary (https://en.wiktionary.org/wiki/Wiktionary:Main_Page) やPerseus (https://www.perseus.tufts.edu/hopper/)でしょうか。ラテン語、ギリシャ語などの語形変化が豊かな言語でも、各活用形から元の動詞にあたることができます。スワヒリ語だとOnline Swahili - English Dictionary (https://www.goswahili.org/dictionary/) がありますが、接頭辞の組み合わせだけで数十通りもあるので、さすがに全ての語形は掲載されていません。

まとめ

最初に述べた二つの疑問に対して、今回見たことを改めて述べます。

世界の言語の辞書の見出し語にはどのようなバリエーションがあるのか。それらは言語の特徴とどう関連するのか。
文字順の排列から内容形態素を検索するのが効率的な形を選択する傾向にある。どこに文法形態素が位置するかによって、接頭辞を排除したり、語根だけにしたりする。

一つの語根が複数の語形を持つ時、見出し語としてどれを選択するのか。
より無標らしい形式を選びそうだ。終止形と終止連体形がある時は終始連体形が好まれそうだ(が例外もある)。

長々と書きましたが、それははじめからそう予測できそうだよね、という結論です。

ここまで読んでくれた人、ありがとうございました。Feliz navidad! Prospero año y felicidad!

あとがき

この企画で色々な言語の辞書を読んでみた感想を羅列します。

・色々な言語の構造をちょっとでも知ることができて面白かった。例えば「アイヌ語は抱合語だ」という知識はあったけれども、辞書の見出し語形がどのような形なのかを理解するためにはもう少し調べる必要があったので、やや理解が進んだ。

・辞書の凡例や編集方針を読むのが楽しかった。「編纂作業は大変な困難で途中で投げ出したくなったが…」とかネイティブスピーカーへの感謝とか「この辞書は〇〇を目的としているので、この語形を選ぶことにした」とかを読むことで辞書の性格が浮かび上がってくるようだった。 

・言語学大辞典すごい。服部四郎すごい。文献を読んでると本当に色々なところで服部四郎が出てくる。

・東京外国語大学の図書館すごい。いろんな言語の本がある。

・アラビア語と英語すごい。色々な言語にアラビア語と英語からの借用がある。

・辞書に凡例、見出し語形の選定基準、排列順、簡単な文法概説を付けておくと読む人にとってやさしい。文法概説があることの嬉しさ。文法概説がないことの絶望。

・自分が専門にしていない言語を扱うのって怖い!色々な言語のデータを集めて類型論とかちゃんとやってる人すごい。

この記事が気に入ったらサポートをしてみませんか?