見出し画像

謎に包まれたX(ツイッター)のコミュニティノート!どれだけの数があるの?どういう人が対象となってるの?驚きの調査結果を公開!!! (日本編)

ツイッターは世界中の人々が情報を共有し、交流するプラットフォームとして広く知られています。そんな中、日本では最近Twitterの新機能である「コミュニティノート」のが話題になっています!
コミュニティノートは"誤解を招く可能性のあるツイート"に対し、ユーザーが協力して"役に立つノート"を追加できるようにし、正確な情報を入手できるよう目指す機能で、不確かな情報に対するファクトチェックの役割を担う可能性が期待されています!

では、この日本で導入されたばかりのコミュニティノートですが、実情はあまりわかっていません。
例えば

・コミュニティノートの量ってどんな感じ?

・どんなコミュニティノートが人気?

・コミュニティノートを作るのはどんな人?

・どのようなツイートにコミュニティノートがつけられるの?

・コミュニティノートの対象となる人はどんな人?

といった疑問がありますよね!
私達は、なんと、コミュニティノートのデータ*¹を用いて、この謎や特徴を明らかにするのを試みてみました!

*1: コミュニティノートのデータはhttps://twitter.com/i/communitynotes/download-dataから取得。取得日時は2023年7月25日16時 (日本時間)


コミュニティノートの量ってどんな感じ?

今回の調査では、日本語に注目して分析*²してみました!コミュニティノートが作成された数はどうなってるのでしょうか?

こちらが結果になります!

コミュニティノートの作成日と作成数の時系列。オレンジ色がラベルにはMisleadingが付与、青色のラベルには、Not_Misleadingのラベルが付与されたもの。左側の縦線が日本に対してコミュニティノート貢献社を募集した日、右側の縦線が日本での閲覧を開始した日。

コミュニティノートは7月25日の段階では4466件作成されています。そしてその作成数が日々増えてることが上の図からわかりますね!左側の縦線が日本でコミュニティノートの参加者を募集開始した日で、右側が閲覧開始を行った日時なのですが、どちらのタイミングでも上昇バーストが見られますね。閲覧開始してからは1日100件ものコミュニティノートが作成されるなど、今後もコミュニティノートの役割は重要になっていきそうです!

*2: コミュニティノートのデータから日本語で作成されたコミュニティノートと、コミュニティノートの対象となった投稿のうち日本語(lang:ja)のものを抽出。コミュニティノートには言語ラベルが付与されていないため、Pythonライブラリであるlangdetectを用いてlang:jaと判定されたものを抽出

どんなコミュニティノートが人気?

コミュニティノートには、このコミュニティノートが人気だったかどうか?投票できる場所があります。この投票結果や投票数を見ることで人気のコミュニティノートについて知ることができそうです!

このコミュニティノートの評価ですが、「はい」を投票すれば1ポイント、「いいえ」を投票すれば0ポイント、「少し」を投票すれば0.5ポイントという単純なスコアをつけて見てみると、なんと、日本語のコミュニティノートには世界のノートと比べ「役に立った」傾向が強いことがわかったのです!*³なぜなんでしょうか?これにはさらなる調査が必要かもしれません。

次に特に注目されているコミュニティノートですが、日本語の中でも特に投票数が多かった上位5つのコミュニティノートを示したいと思います!

1位:毎日新聞による「国籍」に関するツイート
投票数: 3396 評価値: 0.971
https://twitter.com/i/birdwatch/n/1676585113767886852

2位:望月衣塑子による「IAEA」に関するツイート
投票数: 3375 評価値: 0.983
https://twitter.com/i/birdwatch/n/1676585113767886852

3位:NHK Newsによる「マイナンバーカード」に関するツイート
投票数: 1732 評価値: 0.951
https://twitter.com/i/birdwatch/n/1681303651661516800

4位:宋 文洲による「火災情報」に関するツイート
投票数: 1732 評価値: 0.996
https://twitter.com/i/birdwatch/n/1676967279874154499

5位:阿部岳 / ABE Takashiによる「コミュニティノート」に関するツイート
投票数: 1685 評価値: 0.901
https://twitter.com/i/birdwatch/n/1681666380725190656

これらの結果を見る限り、注目されているコミュニティノートの多くは「役に立つ」という評価が割り当てられることがわかりますね!


*3: 各言語におけるコミュニティノートの平均スコアを算出したところ、Englishは0.591、Spanishは0.624、Portugueseは0.639、Frenchは0.645、Germanは0.598、Italyは0.616という0.60前後であるのに対し、Japaneseは0.751と役に立つという評価がつけられやすい傾向が見られる。また、日本語のコミュニティノートの数は今のところ言語別で4番目である。

コミュニティノートを作るのはどんな人?

コミュニティノートを作り人はどんな人が作ってるのでしょうか?これについて私達は調査してみたところ、何もわかりませんでした!というのも、コミュニティノートの作成は匿名であるため、作成した人がどういった人なのか知ることができません。
ですが、コミュニティノートAとコミュニティノートBの作成者は同じかどうかは知ることができます。そこで、コミュニティノートを作成している人はどれくらい作成しているかを見てみたところ、以下のような結果になりました!

各コミュニティノート作成者のコミュニティノート作成数。横軸が作成ノート数で、縦軸がCDFとなっている。

これはコミュニティノートの作成数を累積分布で可視化したものになっています!これを見てみると、作成したユーザのうち約47%程度が1件のみのコミュニティノートを作成しており、約91%程度が10件以下のコミュニティノートを作成していることがわかります。逆にいうと、約9%程度の80人は10件以上のコミュニティノートの作成を行っておりプラットフォームにものすごく貢献しております!感謝ですね。
ちなみに、最もコミュニティノートを作成したユーザは日本語関連の投稿に408件ものコミュニティノートを作成しています!ちなみにそのユーザにはとある秘密があるのですが、、、それは後ほどわかってくることです。

どのようなツイートにコミュニティノートがつけられるの?

コミュニティノートがここ数週間で多くの人々に作成されてきているようですが、では実際どのようなツイートに対してコミュニティノートが作成されているのでしょうか?今回トピックモデルというやり方*⁴*⁵でツイートを8つのクラスに分けてみました!

結果、以下のようなになりました!

話題になってるトピックとして、政治やワクチンだけでなく、地震やジェンダーなどについても多く取り上げられていることがわかりますね!これらのトピックの時間的推移を見てみると以下のようになります。

各トピックの投稿数の時間的推移

トピックごとに大きな違いはみられませんが、Topic3(外交)が波が見られ外部のイベントと対応している可能性が高いことや、Topic5(保険)やTopic8(ジェンダー・コミュニティノート)が日本でのコミュニティノート開始によって多く増加したといった傾向が見られそうです。

ですが、やはり一際目を引くのはTopic2(地震)のこの部分なのではないでしょうか?

2021年7月から2022年7月の地震に関する投稿に対して多くのコミュニティノートが作成。

どうも、2021年7月から2022年7月の地震に関する投稿に対して多くのコミュニティノートが作成されたようです。このTopic2に含まれる2021年と2022年のツイートのユーザを見てみると、なんと、410件のツイートが対象となっており、そのうちの403件のツイートは同一人物のツイート(@earthquakejapan)であることがわかりました!
しかも@earthquakejapanの投稿に対して、コミュニティノートは483件作成されており、そのうち、404件と57件はそれぞれ同一ユーザによって作成されていたのです。先程、コミュニティノートの作成トップは408件のノートを作成したと述べましたが、そのほとんどは同じアカウントへのコミュニティノートの作成だったことがわかりました。
しかも、そのユーザはおそらく日本以外のユーザで、@earthquakejapanだけでなく、EarthquakePrediction(@EarthquakePrediction)やFrank Hoogerbeets(@hogrbe)などの地震関連の投稿に対して2678件のコミュニティノートを作成していました。
また作成されるコミュニティの多くも"There is no scientific basis for earthquake predictions."から始まるコピーされた文章がほとんどだったのです!(例:https://twitter.com/i/birdwatch/n/1382021081779728384
この件は今後のコミュニティノートの作成のモデレーションに重要な示唆を与えるそうですね。

*4: ツイート文の前処理として、URL、@、ハッシュタグ、絵文字などの削除を行った。そして、トピックモデルに適用するために、Mecabを用いて、ツイート文における助詞、助動詞、記号を削除し、指示代名詞などをStopwordsとして削除するなどの処理を適用した。
*5: トピックモデルとして今回はBiterm Topic Model(https://dl.acm.org/doi/abs/10.1145/2488388.2488514)を採用した。これは短いテキストに最適なもので今回の目的と合致する。またPythonのライブラリとしてbitermplusを用いて前処理したツイートに適用した。今回のトピック数はエントロピーを基準にエントロピーが最小となるトピック数8の分析結果を提示する。

コミュニティノートの対象となる人はどんな人?

コミュニティノートを作成されてしまう人にはどのような特徴があるのでしょうか?例えばフォロワー数やツイートのいいね数が多いとコミュニティノートが作成されやすかったりするのでしょうか?

まずコミュニティノートが作成されている上位5つのアカウントを紹介します!

ID: earthquakejapan, 出現回数: 483
ID: tweetsoku1, 出現回数: 65
ID: HimalayaJapan, 出現回数: 40
ID: kharaguchi, 出現回数: 36
ID: livedoornews, 出現回数: 34

となりました!@earthquakejapanが最も多いのは先程述べた理由のとおりですね。他に多いのはツイッター速報〜BreakingNews(@tweetsoku1)や連新社(@HimalayaJapan)などでまとめサイトなどがコミュニティノートの対象となりやすそうですね!

次にコミュニティノートの数とフォロワー数の関係ですが、弱い相関は見られたものの。有意な関係ではありませんでした!

ユーザのフォロワー数と彼らが受けたコミュニティノートの関係。一つ一つの点がユーザに相当。

また、コミュニティノートとファボの関係は以下の形になりました。
見てみると、コミュニティノートのうち20%程度がイイネ数100以下の投稿についており、50%程度がイイネ数1000以下の投稿に付与されており、やはり人気や人目の付く投稿に多くのコミュニティノートが付与されているという傾向がわかります!

横軸はイイネ数で累積分布。50%程度のコミュニティノートは1000件以上のいいねがついた投稿に付与されているのがわかる。

また、先程述べた@earthquakejapanと似たような傾向ユーザはいるのでしょうか?
同じ人から10件以上のコミュニティノートが付与されたユーザとして以下の方がおり、似たように、同じユーザからコミュニティノートを記述されてばっかりのユーザが数名ほどいることがわかります。

【永江の新垢】意味不明の凍結された永江一石です
連新社
髙安カミユ(ミジンコまさ)
Japan Earthquakes
カヘルの地震予想
岡本貴晶(タカ太郎)

今後コミュニティノートを続けていくことで、そのようなユーザも増え続けていくかもしれません。


調査の結果は以上となります!いかがだったでしょうか?

コミュニティノートについて詳しく知れましたか?

良かった方はいいねと高評価ボタンをクリック押してください!



この記事が気に入ったらサポートをしてみませんか?