言語接触時にバイリンガルが残る割合【論文紹介】#1

自分のリハビリも兼ねて、ここしばらくは週1本、気になった論文を一般向けに紹介する記事を書いていこうと思う。主に、自分の専門の統計力学の分野でarXiveにアップされたものから拾ってくるつもり。
Statistical Mechanics authors/titles recent submissions (arxiv.org)

(注意)arXiveに掲載されるのは査読のないプレプリントなので、間違いがある可能性があります。過去にはリーマン予想やコラッツ予想の証明や、常温常圧超電導の報告と称する論文も掲出されたことがあります。また、論文の口車に乗せられて、私の記事でも間違ったことをそのまま書いてしまう可能性があります。

さて本題。今週紹介するのは、10月2日(月)掲載のこちら。
Language dynamics within adaptive networks: An agent-based approach of nodes and links coevolution
変化するネットワークにおける言語の動力学:ノードとリンクの共進化に関するエージェントベースのアプローチ
2309.17359.pdf (arxiv.org)

島国の日本ではあまり実感がないかもしれないが、言語集団の境界で言語が混在している地域が世界中にある。例えば、ドイツ語とフランス語という大きな言語集団の境界にあるベルギーやスイスでは、両言語が混在している地域がある。家庭内言語がドイツ語の家とフランス語の家がモザイク状に隣合っていたり、バイリンガルがたくさんいたりする。

なぜこのような言語の混在が起こるのだろうか。きれいに境界を引いて完全にどちらかの言語に合わせたほうが楽だと思われるのに、このような混在が解消されずに残り続けるというのは不思議ではないだろうか。これをモデル化して解析・考察を行うのがこの論文の趣旨だ。

ということで、次のようなシミュレーションモデルを設定する(これによってどんな面白い言語現象が再現されるだろうかワクワク)。
言語的に相互作用するN人の話者(エージェント)の集団を考える。各話者はAという言語とBという言語を話しうる。
i番目の各話者には$${x_i}$$という0~1の値が割り振られ、1なら言語Aを、0なら言語Bを話し、中間の値ならその値に応じた好みの強さで言語を選ぶ。
i番目とj番目の話者の会話には$${S_{ij}}$$という0または1の値が割り振られ、1なら両者とも言語Aを、0なら両者とも言語Bを話す。これに中間の値はない。
さらに、周囲から受ける言語の圧力$${F_{ij}}$$と、その組が選ぶ言語の好み$${P_{ij}}$$が次のように定義される。
$${F_{ij}=\frac{k^A_i+k^A_j-2S_{ij}}{k_i+k_j-2}}$$
$${P_{ij}= \begin{cases} \frac{x_i x_j}{D} & \text{if $D\not= 0$,} \\ \frac{1}{2} & \text{othewise}\end{cases}}$$
ここで$${k_i}$$, $${k_j}$$はそれぞれ、i, j番目の話者とつながっている話者の数、
$${k^A_i}$$, $${k^A_j}$$はそれぞれ、i, j番目の話者とつながっているA言語話者の数、
Dは両者の好み$${x_i}$$の合い具合$${D=x_i x_j+(1-x_i)(1-x_j)}$$、両者ともどちらでもいいと思っている場合はD=0となり、1/2の確率でランダムにどちらかが選ばれることになる。

話者i,jとその周りのネットワーク・各種値の例(本論文Fig.1より)

一気に定義をたくさん書いたが、試しに、論文にあるこの図で、言語の圧力$${F_{ij}}$$と言語の好み$${P_{ij}}$$を計算してみよう。
$${x_i}$$, $${x_j}$$と、つながり方は、初期値はランダムであらかじめ決められている。
$${P^A_{ij}=\frac{x_i x_j}{D}=\frac{\frac{3}{5}\cdot\frac{1}{4}}{\frac{3}{5}\cdot\frac{1}{4}+\frac{2}{5}\cdot\frac{3}{4}}=\frac{1}{3}}$$
また、B言語を好む傾向はA言語の残りなので、
$${P^B_{ij}=1-P^A_{ij}=\frac{2}{3}}$$
i番目の話者につながっている話者は5人、うちA言語の話者は3人、j番目の話者につながっている話者は4人、うちA言語の話者は3人、$${S_{ij}=1}$$なので、
$${F^A_{ij}=\frac{3+3-2}{5+4-2}=\frac{4}{7}}$$
また、B言語の圧力はA言語の残りなので、
$${F^B_{ij}=1-F^A_{ij}=\frac{3}{7}}$$

そして、この話者i, jの組が会話を行ったとき、$${F^A_{ij}<P^B_{ij}}$$つまり周りがA言語を話している圧力よりもB言語を話したいという好みが強い場合、$${S_{ij}}$$が1だったのが0に変化する(この図は変化する例だが値によっては変化しない場合もある)。
これが図の下に書いてある数式の意味で、この組が思っている言語の好みが圧力に打ち克った場合、使われる言語がA言語からB言語に変化することを意味する(AとB、1と0が逆の場合も同様)。

ちなみに、ここまでは先行研究(1609.00078.pdf (arxiv.org))と同じで、さらにこの話者の好みによってネットワークがつなぎ変わるという点が本論文の新規性である。気に入らない隣人とのつながりはなくなって、隣の隣を探して話が合いそうな人と新たにつながるというネットワークのつなぎ変わりが起こるのである。上図の例では、i番目の話者はA言語話者であるが、相手や周りの状況によってB言語を使うことになった。これはi番目の話者にとっては少し不満なことであるが、そうではなく、j番目の話者の隣人からより不満の少ない話者にネットワークをつなぎ変えることを認めるのである。
言語の切り替わりが起こるかネットワークのつなぎ変わりが起こるかは確率的で、
$${S_{ij}}$$が1→0に変わりそうなときは、$${1-(x_i, x_j の小さいほう)}$$の確率、
$${S_{ij}}$$が0→1に変わりそうなときは、$${x_i, x_j}$$の大きいほうの確率でつなぎ変わりが起こる。

左の状態からの反応
右上に行くのが話者i, jの組がB言語に変わるパターン
右下に行くのがネットワークがつなぎ変わるパターン

図で示すと、左の状態から右下に行く変化も認めるということである。数値は先の図と同じ。
なお、ネットワークの初期条件はランダムだが、全話者は何らかの形でつながっていて孤島はないものとする。

さて、このモデルを考える上で重要なのは、シミュレーションするのはあくまで1組ずつの話者同士の反応だけだということ。それをコンピュータの力で何万、何億も繰り返すと、都市や国家スケールでの言語集団の様子が見えてくる(エージェント数がNのとき、つながりをランダムに1つ選んで反応させ、確率qで変化を起こす。それをN回行うのを1モンテカルロステップと言い、この論文では$${10^5}$$モンテカルロステップ行った)。シミュレーションはミクロに行い、考察はマクロに行って興味深い現象を見出す、これがタイトルにもあるエージェントベースモデル(Agent Base Model: ABM)の面白いところだ。

では、コンピュータが吐き出してくれたシミュレーション結果を見てみよう。まず注目すべきグラフはこれ。

ネットワークのつなぎ変わりがない場合(左)とある場合(右)のエントロピーH0の変化

重要なのは緑で示される$${H_0=-(\frac{L_A}{L}log(\frac{L_A}{L})+\frac{L_B}{L}log(\frac{L_B}{L}))}$$
ここでLは全体の組の数、$${L_A}$$, $${L_A}$$はそれぞれ全体でA言語、B言語を話す組の数。
$${H_0}$$はエントロピーと解釈でき、全体がどれほど混ざり合っているかを示す。このおもちゃが「エントロピー減らし」と言われるように、2つが混ざり合わなくなるほうがエントロピーの低い状態である。

グラフは縦軸の大きさが違うが、赤と青の変化幅はほぼ同じで、緑で示されるエントロピー$${H_0}$$は全然減らなくなっている
左のグラフで示される、つなぎ変わりがない場合にエントロピーがゼロになるというのは、完全に分かれてきれいに1本境界が引ける状態になるということ。
そしてネットワークのつなぎ変わりを許すと、エントロピーが全然減らなくなる、つまり混ざり合った状態が維持されるのである。

次に注目すべきグラフはこれ。

地域人口と多数派、少数派、バイリンガル割合の関係
シミュレーション結果(左)と現実の言語混在地域での割合(右)

まず左のグラフは、シミュレーションで話者の数を変えてみて、多数派(緑)・少数派(赤)言語のモノリンガル話者とバイリンガル話者(青)の割合を調べてみたものである。人口が少ないと多数派に押されるが、人口が増えれば多数派と少数派は割合が近づいていき、バイリンガルも一定割合残り続けるという結果が見て取れる。これは前述のエントロピーが減らないことからも推察されるが、混ざり合った状態が維持されるということである。

そして右のグラフは、現実のキプロス、ラトビア、スイス、ベルギーの人口統計から同様に、多数派、少数派、バイリンガルの割合を示したものである。シミュレーションで得られた、サイズと各集団の割合とかなり似ている。
ただ、現実のほうが多数派の割合が多めになっているのは、混ざり合っている地域だけでなく多数派だけの地域もカウントしてしまっているからではないかと考えられる(混ざり合っている地域のモノリンガルか、多数派だけの地域のモノリンガルかは判断が難しい)。
2つの言語が接触する領域では、多数派、少数派、バイリンガルが人口規模に応じてこれくらいの割合で混ざり合うのは世界的に普遍的な現象であり、この研究ではそれをうまくシミュレーションできたと言える。

話者の好みによってネットワークがつなぎ変わることを許すことで、言語の混在が残ってしまうというのは逆説的ではないだろうか。話者個人としては同じ言語を話す不満の少ないほうに流れて行っているのに、全体としてみると言語の混在という不満が残ってしまうのである。
エージェントベースモデルといい、創発現象の面白さが垣間見れる面白い論文だと思う。

この記事が気に入ったらサポートをしてみませんか?