二項対立論を超えるために二項対立を使う：一般化ユーグリッド距離を用いたイデオロギーの分極化の分析

2023年3月18日 19:54

「分断」という単語は様々なニュースや学術論文で使われている。たとえば、政治における問題では、右派と左派に分かれるような対立(たとえば妊娠中絶)が典型的な例といえる。このような、対立構造ないしそのダイナミクスのことは学術的にはpolarizationと呼ばれる。

polarizationには様々なパターンがあり、政治的信条を基礎とするpolarizationがすべてというわけではないが、ソーシャルメディア分析でよく分析されるトピックは、先の例のようなideological polarizationである。メディアでもよく使われる「分断」という単語を使いたいが、polarizationには学術的には分極化/分断/二極化などの訳があてられことが多い。そのため、以下ではpolarizationを単に分極化と訳すことにする。

polarisationを分析するには

たとえば、TwitterなどのSNSでデータを取得すれば、そこで各ユーザーが政治家や政治のトピックについてどのような意見が表明されるかを分析しする事ができ、「ユーザーの意見がどの程度別れているのか」や「(なにかしらで定義された)ユーザー同士のつながりがどの程度分かれているのか」を調べることで分断が分析される。つまり、意見や構造(ネットワーク)の別れ具合などが分析されているわけである。意見の分布が極端に分かれていれば分極化しているし、2つにうまく分かれた構造(ネットワーク)があれば分極化していると言えるだろう。

分析の限界と問題点

このような分極化の分析には様々な限界がある。まず、単に意見だけを分析すると、つながりという構造の影響や役割を無視してしまう。逆に、単に構造を見るだけだと、意見の分極化を無視してしまう。また、分極化された構造を暗に仮定して、2つのグループのサイズがどの程度なのかを調べているという、ある意味で欲しい結果を仮定して分析してしまうことも多い[1]。

分析できないトリレンマ(3パターン)の存在

これらの分析の問題点は簡単に言ってしまえば、意見と構造(ネットワーク)という2つの要素をうまく組み合わせた分析がされていないということである。この問題点が深刻なのは、単に分極化といっても

意見だけ分極化
構造(つながり)だけ分極化
意見と構造(つながり)どちらも分極化

の3つのパターンで組み合わされた分極化がありうることである。意見と構造が互いの分極化度合いを打ち消す場合を考えれば、構造だけ/意見だけを分析する場合は3つの中で1.5パターンくらいしかカバーできないといえよう。もちろん、隣人とどの程度同じ意見を持つのか、といった各個人が直面する構造を考慮した分析もあるが、構造全体を考慮したグローバルな分析がされているわけではない。

一般化ユーグリッド距離による分極化の指標

Hohmann, Marilena, Karel Devriendt, and Michele Coscia. "Quantifying ideological polarization on a network using generalized Euclidean distance." Science Advances 9.9 (2023): eabq2044.

https://www.science.org/doi/10.1126/sciadv.abq2044

このような問題を克服するためにHohmannらが提案したのが一般化ユーグリッド距離(generalized Euclidean distance)を利用してイデオロギー分極の度合いを分析する手法である。かれらが提案した分極化度合いの指標は、意見と構造(ネットワークの繋がり）をミックスさせている、

という指標である。a,bは距離を図りたい意見のベクトルである。この指標のミソはL†と表現されているラプラシアン行列(のムーアペンローズ逆行列)である。ラプラシアン行列で表現されているのははざっくりというと、あるノードから発信された情報が繋がったノードに伝わっていく様子である。Twitterにたとえると、自分の発信したツイートが他のユーザーに伝わっていく様子をラプラシアン行列で表現できる。

Hohmannら提案したこの指標δは

a,bベクトルで表現された２つの意見の距離を測る
その意見の離れ具合を図る時にLという繋がりの表現を考慮する

という2つのポイントを考慮して分極化度合いを数値として計算するのである。

機械学習や統計を勉強したことがある人は、この式を見てマハラノビス距離を思い出したかもしれないが、マハラノビス距離では共分散行列で表現されていた２点間の関係性が一般化ユーグリッド距離ではラプラシアン行列に変わったものと考えるとわかりやすいかもしれない。

人工データをつかった分析

Hohmannらが論文でおこなった人工データを使った実験では、彼らの指標δが既存の提案指標(ρやRWC)よりもうまく分極化を捉えていることがわかる(提案指標の説明は原論文に譲る)。下の３つの図では、先にのべたようなパターン全てにおいて指標δが分極化を捉えていることがわかる。

1.意見だけ分極化

2.意見だけ分極化

3.意見と構造(つながり)どちらも分極化

実証分析

さて、かれらの指標を現実のデータに適応させた時にどのような結果になるのだろうか。まず、論文では政治トピックに関するTwitterにおける議論が分析されている。

結果として、銃規制や妊娠中絶では分極化の度合い(δは11.17と16.71)が強いが、皆保険制度（オバマケア)については比較的その度合は低いことがわかった(δは9.44)。この図では、上段に構造(ネットワーク)、中断に意見の分布がプロットされているが、オバマケアに関する議論は構造においてのみ分極化がみられ、中断の意見の分布ではあまり分極が見られないことがわかる。これは、先に分類した分極化のパターン2に当たる。

この論文の実証分析のユニークな点はアメリカの下院のデータをつかった分極化の分析をしている点で、アメリカ合衆国第81議会(1949–1951)からアメリカ合衆国第116議会(2019-2020)までの分析がされている点である。この分析では、同じ法案に投票した頻度が高い議員をネットワークに置いてつなげて構造を作り、下院議員の「意見」はDW-NOMINAT法という手法で法案への投票行動などから推定された。

アメリカは二大政党制なので、当然ながら構造や意見はどの時点でも２つに分かれている。にも関わらず、最近に近づくにつれて分極化は高まっていることがわかる。下段の指標δが右に(近年)に近づくについれて高まっていくことがわかる。

タイトル回収

この論文は、構造と意見という２つの要素を考慮する指標を提案することで、二項対立を暗に仮定していた既存研究論文の問題点を乗り越えたことにユニークさがある。つまり、二項対立論(分極化)を超えるために二項対立(意見と構造)を使ったのだ。

文献

[1]Political polarization on twitter. (ICWSM 2011, ICWSM Test of Time Award) by Conover, M., Ratkiewicz, J., Francisco, M., Gonçalves, B., Menczer, F., & Flammini, A.

この記事が気に入ったらサポートをしてみませんか？