#検察庁法改正案に抗議した人は本当はどのくらいいたのか
5月8日から,突然
#検察庁法改正案に抗議します
というタグがトレンド入りしました.
どのくらいの量ツイートされたのかを見てみると,5月8日20時から5月11日15時までの間に,リツイートを含めて4,732,473件,リツイートを除くと,564,797ツイート,拡散に関わったユーザは588,065アカウントでした.
1時間ごとのツイート数を見るとこんな感じ.
なんでこんな爆発的に広まったんでしょうか.これだけ広まると,逆にボットとかスパムの影響じゃないの?と考えてしまうのがソーシャルメディア研究者の基本です.
というわけで,調べてみましょう.
早速データを収集します.今回は周辺データも見ようということで,「#検察庁法改正案に抗議します」だけじゃなくて,「検察庁」「定年延長」「三権分立」でデータを収集しました.
ツイートしたのはボットだったのか?
まず最初に疑われるのが,ボットが大量にRTしたりツイートしたりしているんじゃないの?という疑いです.この辺は基本中の基本.
ボットが活躍していたかどうかを見極める簡単な方法の一つが,アカウントごとのツイート数やリツイート数の歪みです.
通常,ボットでなく自然状態で,ツイート回数とその数ツイートした人の比はスケールフリー性を持つことが知られています.簡単に言えば,5回ツイートした人が200人,10回ツイートした人が100人いたとすると,20回ツイートした人の数は50人,40回ツイートした人の数が25人程度になります.
もしボットが大量にいると,この宇宙の(誤)法則が乱れるわけです.じゃあ,それを確認するにはどうすればいいかというと,横軸にツイート数,縦軸にツイート人数をプロットした図を両対数で示して,直線になればおおよそスケールフリー性があるといえることになります.早速「#検察庁法改正案に抗議します」とツイートした回数を横軸に,その回数ツイートした人の数を縦軸にプロットした図を見てみましょう.
なんとも綺麗な直線になりました.ほぼスケールフリー性が成り立っているといってよいでしょう.そもそも1回しかツイートしていない人が全体の80%を占めているので,ボットが大活躍というわけではなさそうです.
少なくとも「ほとんどがボットだった」という推測は正解ではなさそうです.
新規アカウントが大活躍だったのか?
では,このツイートのために新規アカウントが大量に作られたという説はどうでしょうか.ツイート数1のアカウントが直線状にある以上,影響力があるほど新規にアカウントが作られたとは思えませんが.
この期間に収集したデータの中で,初めてツイートしたユーザを抽出したところ,5,194ユーザが存在することがわかりました.関係ツイートを行ったユーザの0.7%です.正直,影響力があるというほどではなさそうです.
影響はなさそうですが,これが多いのか少ないのかは気になるところ.通常三日間で新規ユーザはどのくらい存在するのかを調べるため,ツイッターストリーミングでランダムにとれるツイートから,3日間の間に新規ユーザがどのくらいいるのかを確認してみたところ,0.3%でした.
さて,これは一体どういうことなのでしょうか?果たして新規アカウントを意図的に作ってツイートしたものが多いということなのでしょうか?
そこで,次にデータ収集期間で初めてツイートした時の当該アカウントの総ツイート数を調べてみて,検察庁関連のツイートとストリーミングのツイートで比較してみました.
このグラフでは,横軸に各アカウントのこれまでの総ツイート数,縦軸は当該アカウントが全体に占める割合を示しています.
その結果,およそ総ツイート数が50くらいまでのライトユーザが「#検察庁法改正案に抗議します」関係のツイートを行っていることがわかります.しかし,その増加量は両対数でほぼ直線的となっており,異常な量の新規アカウントが作られてツイートがなされたというほどではなさそうです.
横軸にアカウントの総ツイート数,縦軸が累積の割合をとってみると,「#検察庁法改正案に抗議します」関係のツイートについては,これまでの総ツイート数400ツイート以下のライトユーザが比較的多く,それ以上のユーザが比較的少ないということがわかりました.つまり,今回の件では比較的ライトなユーザが主にツイートを行っていたのではないか,という推測がなされます.
ツイート数が10以下のアカウントによるツイート数+リツイート数は30,408件でした.全体の1%以下ですから,水増ししたというには物足りないですね.
スパムが大半だったのか?
次に,スパムについて考えてみましょう.スパムの定義は難しいですが,同じハッシュタグを使ったツイートを大量投稿しているアカウントがあったら,スパム的と判断してみます.ここでは,当該ハッシュタグが含まれるツイートが何回ツイートしたユーザによってツイートされたのかを累積で見てみます.
これを見ると,全体の44%のツイートは1回しか「#検察庁法改正案に抗議します」が含まれるツイートを投稿していないアカウントによるものなのでした.80%のツイートは当該ハッシュタグを10ツイート以下しかツイートしなかったユーザによってツイートされていたので,さすがに「ツイートのほとんどがスパムだった」という仮説は成り立たなそうです.
一方で,20回以上「#検察庁法改正案に抗議します」が含まれるツイートを投稿したアカウントによるものである割合が10%くらいありますので,564,797ツイート中5万ツイートくらいは若干スパム気味と考えても良いかも知れません.
次に,拡散の方を見てみましょう.リツイートはクリック一つでできてしまうため,何回リツイートしたらスパムなのか判断が難しいところです.とりあえず累積でリツイートが占める割合を見てみましょう.
この結果,リツイート全体の70%がリツイートを20回以上行ったアカウントによるものであることがわかりました.50%ラインで72リツイートなので,リツイートの半分以上は70回以上リツイートしたアカウントによるもののようです.これはちょっと多すぎな気がします.スパムかどうかは分かりませんが,「#検察庁法改正案に抗議します」をやたらとリツイートした人たちによってリツイート数が稼がれたのは間違いなさそうです.ちなみに,72回以上リツイートしたアカウントは12,732個ありました.全体の2%くらいです.2%のアカウントで半分以上の拡散を実現.う~ん,これは若干スパム臭い.
ということで,
・ツイートを行ったアカウントにはあまりスパムはいなかった
・少数のアカウントによって大量に拡散された
と言ってよいのではないかと思います.
「#検察庁法改正案に抗議します」反対派は頑張ったのか?
さて,こういう政治的なツイートの場合,大きくリベラル派と保守派に分かれるのが日本に限らず世界のツイッター研究者の常識です.日本の場合だとどちらかというと,ネトウヨvs反アベという構図ですが.
というわけで,各ツイートをRTした人をベースにツイートを分類して,どんなツイート群があったのかをツイートネットワークをもとに調べる手法を使って分析してみました.その結果がこちら.
正直,今までどんなデータを分析しても,必ず二つのネットワークに分かれる様子が見えていたのですが,今回の「#検察庁法改正案に抗議します」に関しては,関係単語を使ったデータもとっているにもかかわらず,検察庁法改正案に賛成するツイート群がほとんど存在しないことがわかりました.圧倒的抗議ツイート.正直こんなの見たことがない.
一応細かく見ていくとところどころ中心の円から外れたツイートがあって,それらは検察庁法改正案に反対していないツイートなのですが,散発的なうえに数も少ないという状況です.
この状況を見る限り,どうやら今回の件に関しては,「#検察庁法改正案に抗議します」という動きがそうではないほうと比べると,圧倒的に情報の拡散に成功していると考えてよさそうです.
結論
・「#検察庁法改正案に抗議します」タグをツイートした人にスパムやボットは多くない
・拡散に関わったユーザは588,065アカウント
・450万ツイート拡散されたが,その拡散の半分は一部のアカウント(全体の2%)によるもの
・リツイート数が10回以下のアカウントによる拡散数は100万ツイート
・「#検察庁法改正案に抗議」しない側の反応はあんまりない(ちゃんと調べきれてない・・・疲れた)
ちなみに,この結果はあくまでもこういう拡散があったということだけを言っているため,「検察庁法改正案」の良し悪しについては何も語りません.
あと,拡散の多くが少数のアカウントによって行われたからといって,「#検察庁法改正案に抗議」している人が本当は少ないということも意味しません.事実拡散のうち100万リツイートくらいはスパムではないアカウントによって行われている可能性が高いのですから.100万リツイートって結構なもんでっせ.
数という点で言うと,このハッシュタグの拡散に関わったユーザは588,065アカウントあったという事実があるだけです.
このデータから,「#検察庁法改正案に抗議します」タグのほとんどがスパムだから見る価値無しと判断するのは早計だと思います.まあ,数だけ見て450万ツイート拡散した!と喜ぶのもいかがなものかとも思うけど.
はー疲れた.結局一日かけて調べてしまったじゃないか.おかげで論文が進まないぞーw