メモ 「現実」記述共通化によるSNSプラットフォームの横断的比較サーベイ

SNSごとに異なる「現実」を横断的に比較するには、元データや解析方法の共通化は難しそうなので、結果を共通化するのがよいかもしれない。SNSごとに異なるデータ、異なる手法で、共通の「現実」記述フォーマットに合わせた結果を出す……ということをぼんやり考えたりした。

SNSプラットフォームごとに我々が見ている「現実」が異なることことは別記事で紹介した。

SNSによって見える現実が異なる イスラエルとハマスの紛争で浮き彫り、https://note.com/ichi_twnovel/n/neb552d855e52

SNSだけでなく、既存メディアが描き出す「現実」も統計的現実とは異なっていることはプリンストン大学ESOCの一連の研究で明らかにされている。

プリンストン大学ESOCによるメディアの系統的偏向の調査結果、https://note.com/ichi_twnovel/n/n6ec248e524ca

ESOC Working Paper #27: Media Reporting on International Affairs、https://esoc.princeton.edu/WP27

ESOCの研究は実際にメディアに掲載された記事を調査したものだ。同様にSNSに対しても投稿の内容を調査して解析する試みが続けられている。しかし、生の記事からデータを取り出すのとネットからデータを取り出すことには違いがある。後者はSNS側が用意したAPIなどを経由しての処理となる。そのため、Xのように突然APIの提供を止めることや、フェイスブックのように偏ったデータを提供される場合(下記、参照)もある。SNSからデータをもらえるのは助かるが、その一方で都合のよいデータだけを渡されている可能性を常に考慮する必要がある。

フェイスブックは透明性を高めるために、アクセスの多かったコンテンツのレポート「Widely Viewed Content Report: What People See on Facebook」(https://transparency.fb.com/ja-jp/data/widely-viewed-content-report/)を公開している。しかし、このレポートではリーチのみを取り上げており、インプレッションは考慮していない。その結果、「Widely viewed domains」の上位の多くはよく知られたサイトに占められている。しかし、ここでは頻度は無視されている。ひとりの利用者がそのドメインに1回アクセスしても、千回アクセスしても1とカウントされる。そこで、Citizen Browserのデータを元にインプレッションを推定したところ、いろいろ問題ある保守系のサイトdailywire.comやWesternjournal.comが上位に食い込んだ。フェイスブックは意図的に右翼サイトに人気があることを隠そうとした疑いがある。

The Markupのフェイスブック監視アプリCitizen Browserが暴いた実態、https://note.com/ichi_twnovel/n/n41d3498bcf0d

SNSプラットフォームごとに異なる「現実」を比較できる仕組みはほしい。いまのところ、そのようなものはなく、個々のSNSを似たような手法で分析して比較することになる。
横断的に調査できる手法としては、複数の拠点でパケットをキャプチャーして解析するとかかな? 解析手法を共通にして各SNSのデータ形式に対応しておけば可能だけど、VPN使っていたらダメだし、そもそもこれは監視というか盗聴だ。

もうひとつはクライアント側、利用者にパネルになってもらい。同意を得たうえでそのネット上での活動をモニターする方法だ。これは以前、調査報道で知られるThe Markupがフェイスブック調査でやっていた。この方法はフェイスブック以外にも適用可能だ。

The Markupのフェイスブック監視アプリCitizen Browserが暴いた実態、https://note.com/ichi_twnovel/n/n41d3498bcf0d

実装方法などのくわしい内容は下記。

How We Built a Facebook Inspector、https://themarkup.org/citizen-browser/2021/01/05/how-we-built-a-facebook-inspector

日本ではCode for JapanのプロジェクトでBirdXplorer(https://code4japan-community.notion.site/BirdXplorer-f31202e6b4574a08982d867f74340a8b)というXのコミュニティノートを分析するツールを開発している。いまのところXのコミュニティノート限定だが、後述のような拡張を行うことで複数のSNSを横断するような分析もできるかもしれない。

シビックテックによるディスインフォメーション監視ツールの開発、https://docs.google.com/presentation/d/1ETzvMlgzp35y0XkzePTA25WJ6ptLxW3wAnLFZCKHnOI/

もうひとつのアイデアとしては分析のアウトプットを共通にして、SNS横断的な比較を可能にすることだ。入り口のデータや解析手法ではなく、解析結果のフォーマット(構造化されたものやプロトコルかもしれない)を統一して比較を可能にする。
SNSごとにデータを取る方法や解析手法は異なってもよく、その結果を共通の形式にすることで横断的比較を可能にする。たとえば単純にもっともよく使われた単語のランキングでもよいし、多変量解析した結果の「雰囲気」のようなものでもよいし、ワードクラウドや因果ダイアグラムでもよい。
できればさらに横断的に新聞やテレビなども含めて分析できるとよい。
いわば「現実」記述の共通化

などということをとりとめもなく考えた年末。

本noteではサポートを受け付けております。よろしくお願いいたします。