言語は同等に複雑か?(Newmeyer at Abralin 2020より)

「言語は全て同等に複雑か」という問題について考える.まず,言語学で一般的に共有されている見解は以下の通りである.

(1) 言語学上の一般的な見解:

a. 言語の複雑さは形態統語的,言語使用などの面において個別に異なるが,全体の複雑さはほぼ全ての言語において同じ (Well, 1954)

b.「原始的な」言語はない.言語は全て同等に複雑で,世界の有り様を同等に表現できる.

c. 全ての言語は全体の複雑さにおいてほぼ同等である.

世間一般の理解はこんなところになるだろう.

(2) 世間の理解
ギネス記録 1956年 Aranda (Arunta) というオーストラリア言語が最も原始的である.(ジャーナリストのフィリップ・ウィルソンもアボリジニの言語を言語として捉えていなかった)

全ての言語が同等に複雑であると考える理由としては以下の3つの要因がある.

(3) 言語が同等に複雑であると考える3つの理由:

1 ヒューマニズム:全ての人間集団は同等なので,言語もそうである.→ある言語が他の言語よりも複雑だと,複雑ではない言語の方がある意味劣っているということになるかもしれない.それはまた,その話し手が劣っているということを含意し,民族浄化にも繋がりうる.

この議論には欠点がある.子供は誰でもどんな言語でも獲得できる.もし仮に単純な文法があるとすれば,それは単純なこころを含意しているわけではない.言語の複雑さは形態に焦点が置かれているが,単純・複雑な形態は認知に関して何かを明らかにするということはないだろう.

2 言語使用:ある領域での複雑さは別の領域での単純さでバランスが取れている.→言語使用の制約は,言語変化は常にトレードオフを伴い,複雑さにおいてバランスがとれているという.この発想自体は19世紀に遡る.Siweierska (1998)によれば,格表示は緩やかな語順と関連している.印欧祖語の大半は格表示を失い,語順が固定化しつつあるという.また,Matisoff (1973)によれば, 音節構造が複雑になると,音の高低が単純になる.速く話される言語は,音節に秘められる情報が少なくなる傾向がある.しかし,情報効率はどの言語でも類似している.

トレードオフの典型例として挙げられていたのは以下である.
中国語のような形態統語上単純で,形態素のそれぞれが複数の意味を持ちやすくなる言語では,分類詞,畳語,動詞連続などを持つ.また,解釈規則が複雑になる傾向がある.

仮にトレードオフが存在するすると,文法の一部は他よりも複雑化するということを認めることになる.
たとえば,このような事例がある.ベトナム語は動詞の活用形が一つ.Archi語は1,502,839個.Ju|’hoan (a Northern Khoisan language)は93個の子音.Yimas (a lower Sepik language) には12個である (Shosted, 2006)

こう考えれば,トレードオフは常にあるかと言われると,ないだろう.

3 言語理論内の考察:普遍文法の性質により,全ての言語は同等に複雑である.
言語はどれでも複雑で,どの言語の文法も本質的に比較可能である (Chomsky, 1959) チョムスキー自体は一度も全ての言語が同等に複雑であるとは主張していない.ただ,生成文法に共感している人はこのように主張している (Smith, 1999: 168).また,言語器官が生物学的特性なのであれば,それが複雑さにおいてことなるはずがないという意見もある (Moro, 2008).こういった言語理論内の主張には個人的には感化されない.しかし,形式言語理論は形態や語彙の非規則性などを扱っているが,これに従えば,言語間の複雑さが容易に異なりうる.原理とパラメータのアプローチでも,複雑さが言語において違うと言っている.たとえば,パラメータの数が言語の文法を定めるのに必要であり (Baker),その有標性を使って言語の複雑さを計算することもできる (Travis).また,獲得階層が言語の相対的複雑さを測定するのに使えるかもしれない (Biberauer, Holmberg, Roberts).併合の反復の数やインターフェース規則の性質が相対的複雑さを計測するのに使えるかもしれない.言語理論に基づいた複雑さに関する議論はこういったところだろうか.

要約すると,理論言語学の証拠は,全ての言語が同等に複雑かという問題に関しては曖昧である.

そこで,全ての言語は同等に複雑だという主張を潰したければ,言語使用が複雑なトレードオフであるという考え方を潰せばよいということになる.

全ての言語が同等に複雑であるとどうやれば測定できるのか.アプローチの一つが,言語部門の複雑さの度合いを測定,比較する方法である (Grammar-based) McWhorter (2007)によれば, 文法の複雑さは以下の3つから測定できる.


i. Overspecification:顕在的・義務的な意味の区別の表示
ii. Structural Elaboration:規則の数(形態,音韻,統語)ないしはその目録のサイズ(機能範疇,音素など)
iii. Irregularity:不規則性

この基準に従えば,エストニア語はサマリア語よりもずっと複雑ということになる.→エストニア語の属格,部分格の表示はサマリア語に比べて,意味的にかなり特定化されており,構造的に複雑であり,不規則である.エストニア語は形態統語プロセスがかなり多く,不規則的である.

しかし,このような文法基盤に基づいた複雑さ議論に関して反論がある.
i. DeGraff (2001) この分析の背景に理論がない(数えているだけである).表層上,見たものを記述しただけである.記述的,直感的なだけで,理論に基づいているものではない.顕在的な特定化が常に勝つ?
ii. Nez Perceというアイダホ州のネイティブアメリカンの言語があり,可能と必要のモダリティを形態統語的に区別していない.McWhorterの基準を当てはめれば,Nez Perceは英語より複雑ではないということになるが,それは妥当か?文法基盤で複雑さを計測しようとすれば,形態・語彙が多ければ多いほど複雑ということになる.しかし,一つの単語で10,000通りの意味を表す語彙がある言語は全く複雑ではないということになってしまう.
iii. 形態素・語彙の種類が多くなければ,代わりに解釈規則が複雑になる.その例が中国語と類型論的に似ている言語である (Bisang, 2009)

測定方法の二つ目として,言語使用の視点から複雑さを計測することができるとする見解がある (User-based)→第一言語獲得:ある文法は他の文法より子供が獲得するのに時間がかかるのか.

それでは,ある言語の獲得が他の言語よりも子供にとってより時間がかかるのか.以下のような研究がある.


i. Slobin (1982)が英語,イタリア語,セルボ・クロアチア語,トルコ語の獲得を4つの年齢集団に分けて分析.形式と意味との類像性が高ければ高いほど,獲得が早いということが分かった(日本語などオノマトペの多い言語でオノマトペ語彙の獲得が早いのと同じか?).トルコの子供たちは形態の獲得は早いが,統語など(関係詞節)は比較的遅い.
ii. Jakobson (1941, 1968)は音韻要素の獲得で普遍的な順序があると提案.しかし,/c/ (risingのbreve記号あり)はキチェ語の方が英語よりも獲得が早い.頻度が多いからである.
また,社会階層・スタイルの違いにより,獲得が人によって早かったり遅かったりする現象がある.ポーランド語と英語の学歴の高い人たちは構文パタンをそうでない人たちよりも多く,早く獲得する.日本語の敬語にしても似た状況.
iii. ある言語の文法は他の文法よりも使うのが難しいのか?→不明.ただ,存在している全ての文法は定義により使用可能ではある.
iv. ある文法特性は他の文法よりも処理しにくいという議論はずっとある.Derivational Theory of Complexity (Miller and Chomsky, 1963)によれば,適用される変換の数が多ければ多いほど,使用者には難しいと主張されてきたが,DTCは理論に依拠しているものであり,かつ既に廃止されている理論である.
v. Hawkinsの処理からの分析や脳科学・神経学的分析は今後次第?

また,第二言語習得において,成人がある言語の文法を獲得するのに,他の言語の文法より時間がかかるのかを考察すればいいかもしれない.つまり,言語使用の観点から考えれば,ある言語の文法を使用するのは,他のよりも難しいのかという問題を通して文法の複雑さを測定するわけである.

しかし,文法に基盤を置いた言語の複雑さはあくまで概念的な問題である.
言語使用に基盤を置いた言語の複雑さは概念的には一貫しているが,まだまだ断言できる材料はない.

複雑性のトレードオフはよく指摘されている.文法のある領域の複雑さは他の領域の単純さで補償されるのかという問題である.しかし,これは事実であろうか.たとえば,厳密な語順と多くの格表示の関連はよく指摘されるが,それを明らかにした議論はあるか?なぜ我々はそれを信じているのだろうか?以下のような問題があるように思われる.


i. Siewierska (1998)によれば,171言語のうち,9語が格表示と厳格な語順を持ち,5語が格表示がなく,緩やかな語順である.
ii. Dahl (2004; 2009)によれば,Elfdalianというスウェーデンの地域言語の一つは,標準スウェーデン語よりも複雑であるという.たとえば,強勢のある音節などでSandhi(くっつき)現象が標準スウェーデン語よりも多く,格,数,曲用が多く,動詞で人称・数の区別があり,語彙的に決まっている格や名詞句省略がある.
iii. また,ポルトガル語がスペイン語と似ているとは言え,文法的には複雑だという話も関連するかもしれない.
iv. McWhorter (2001b)とParkvall (2008)によれば,クレオールの文法はそれ以外の文法よりも単純であると言われているが,DeGraff (2001)の強い反論がある.
v. David Gilによれば,リアウ州のインドネシア語は単純であり,語内部の形態構造がなく,統語範疇がはっきりしており,構文に特有の意味解釈規則がない.たとえば,Ayam makan (lit. `chicken eat’)は,鶏が食べている,食べられている鶏,鶏を食べる理由などといった解釈が可能である.Gilによれば,この例は多義的ではなくぼんやりとしているのであり,リアウ州のインドネシア語は単純な形態統語構造の埋め合わせのために複雑な意味解釈規則がないとのことである.vi.Maddieson (1984)によれば,音韻にもトレードオフはない.たとえば,子音の数が多い言語は,母音も多い傾向にある.破裂音や摩擦音において,調音法による区別があまりない言語では,調音点で区別を補うということもない.音節・超音節に関する区別にしても同じ.

つまり,文法の複雑性に関するトレードオフについては,はっきりとした区別がつけられるような根拠はない.

伝統的な見方としては,異なる種類の言語と接触してきた言語と言語の固有性は言語の複雑さに影響を与えるというものがあった.しかし,そのコンセンサスはなかった.

昔は,他の言語と接触のない言語は単純になり,接触が多い言語は複雑になると想定されていた.その考えは,「ひとりぼっち」の子供は規則を一般化し,不規則性をなくし,文法を単純化するだろうという想定からきた.たとえば,英語は少しつづ不規則活用の動詞の数を減らし,残っている不規則活用の動詞は高頻度で使用されるのが例だと考えられた.また,言語接触によって語順が不規則になるのもその例だと考えられていた (Harris and Campbell, 1995).アムハラ語は,他の大半のセム語と同じく元々はVOの語順だったが,OV語順と「属格-名詞」の語順を隣接するクシティック語から取り入れたが,前置詞はそのまま(後置詞にならずに)残っている.アホム語というタイの言語は,印欧語のアッサム語,チベット・ビルマ語から「修飾語-主要部」という語順を借用している.

しかし,言語接触が単純化につながるという例も多い (Thomsan and Kaufman, 1988).アナトリア半島のギリシア語は/t, d/に合流することで,/θ, d/を失った.また,トルコ語の借用を通して文法性も失った.ムブグ語 (Ma’a)はクシティック語の特徴である放出音 (ejective),円唇性のある舌背音,バンツー語の単数範疇も失った.

また,接触以外で文法が複雑になる文法化のような現象もある.文法化は範疇の数を増やすので,複雑さが増したということにもなる.たとえば,英語は法助動詞の細かな区別を導入し,ロマンス語やゲルマン語は数詞から不定冠詞,指示詞から定冠詞を発展させてきた.

社会言語学的な観点から,Trudgill (2011)は,接触が少ない孤立語は複雑さを保持し,閉じた仲のいい集団では言語変異が複雑になる傾向があり,成人による言語接触は言語の複雑さを減らし,子供による言語接触は複雑さを増すということを指摘している.また,アイスランド語とフェロー語は比較的孤立していたため,接触の多かったノルウェー語よりも複雑であり,またノルウェー語はデンマーク語よりも多くの点で複雑であると指摘している.これを受けて,McWhorterも成人による言語接触は単純化に繋がるということを指摘している.また,クレオールはクレオール語ではない言語よりも単純である.また,McWhorterによれば,英語は他のゲルマン語よりも単純である.なぜなら,古英語の時代にスカンジナビア人に英語を第二言語として獲得されたからである.その結果,英語は文法性を冠詞から失い,多くの格形態素を失っている.

McWhorterによる関連のある言語間の複雑さの違いを挙げると,中国の北京語は他の中国語よりも単純である.その理由は1世紀のアルタイ語の話し手との接触のせいであり,ペルシア語は他のイラン語よりも単純である.というのも,紀元前に非ペルシア人がペルシア語を習得しようとしていたからである.口語のアラビア語はアラビア語が話されていない地域にも広まったため,古典アラビア語よりも単純である.マレー語,インドネシア語はリンガフランカとして使用されているため,他のオーストロネシア語よりも単純である.スワヒリ語もそうかもしれない.

なぜこういったことになるのだろうか?大人は文法を単純化しようとし,子供は気にしないということがあるかしれない.また,小さな共同体は早い話し方が特徴であり,それが体系的な複雑さにつながるのかもしれない.また,近隣の人たちに悟られないように複雑なシステムを発展させようとすることもあるだろう.

問題は,ほぼ全ての印欧語はここ2000年で屈折システムを単純化してきたことである.この中には,接触がない言語もある.なぜか?
リトアニア語は最も保守的な印欧語だと言われており,印欧祖語の頃の屈折や強勢システムを保持している.しかし,リトアニアは孤立していたとは言い難い.常に,ポーランド語,ドイツ語,ロシア語,スウェーデン語,ベラルーシ語,ラトヴィア語,イディッシュ語と接触してきている.

英語の音韻はノルマンフレンチとの接触の結果,かなり複雑になっている.アサバスカ諸語は他の言語との接触とは関係なく,複雑な子音がたくさんある.Hay and Bauer (2007)は話し手が増えれば,その言語の音素の数も増えやすいということを発見している.ロトカ語,ピダハン語,ハワイ語,マオリ語などの孤立語は音素の数が少ないが,ケチュア語,ズールー語,グルジア語,アラビア語は話し手が多いが複雑な音素をたくさん持っている.
しかし,Lupyan and Dale (2010)は人口サイズと携帯複雑性との間に反比例の関係を発見している.McWhorterとTrudgillが小さな人口サイズと書いた時,「小さい」「大きい」を絶対的か相対的かどちらの意味で書いているのかについては,お茶を濁している.
多くの非西洋語はかつて話し手が多かったともあったが,複雑さについてはかならずしも人口の減少と関連して変化しているわけではない (Nichols 2009).

こういった問題を考えていくと,全ての言語が同等に複雑だと信じる理由はない.言語の複雑さを図る基準は未だに発見されていないと言わざるを得ない.社会的・歴史的要因は確かに言語の複雑さの程度に影響を与えるが,どのようになっているのかはまだまだ議論の余地がある.

ただし,全ての言語が同等に複雑だということは言えないが,全ての言語が複雑であるということだけは確かである.

この記事が気に入ったらサポートをしてみませんか?