調査から見えてきたツイッター投稿のカテゴリ別特徴と誘導操作の痕跡
「Twitter 上における意図的な大規模情報拡散の因子となる特徴点分析 Analyzing Factors of Influence Operations in Twitter」(2022年 暗号と情報セキュリティシンポジウム、林尚弘、嶋田里聖、高山眞樹、田畑唯斗、笠井遥輝、齋藤孝道、https://www.iwsec.org/scis/2022/_abst/1E4-2.pdf)の論文をご紹介したい。日本ではSNSでの情報操作についての調査研究はそれほど多くない。その中でも異なる分野での結果を対照して比較しているものはさらに少ない。この論文は、政治(8)、商用(7)、エンタメ(12)、刑事事件(1)、コロナ(2)の5分野について調査し、比較したものである。()内はカテゴリ内のグループの数。なお、この研究ではリツイートは含まずに分析している。
●結果の概要
ツイート内容の感情分析、ハッシュタグの分析、ハッシュタグ以外の文字の数の分析、ツイート数の時系列分析など、多面的にツイートを分析している。
主な結果を表にまとめたものが下記である。
・政治カテゴリと刑事事件カテゴリでは,Negativeな意見が多い
・政治カテゴリと商用カテゴリでは,ツイートテキストにハッシュタグ以外の文字列が含まれていないケースが多い
議員や政党に関するカテゴリのツイートでハッシュタグのみのツイートが多かったことは、ボットや人為的な操作が行われている可能性を示唆している。また、政治カテゴリではハッシュタグを複数つけたものも多かった。
商用カテゴリでも同様の傾向が見られたが、これはキャンペーン応募条件にハッシュタグを入れることがあったためと推定される。
・政治カテゴリと商用カテゴリにおいて,ツイート数の多い時間帯が類似するツイート群が存在した
この商用カテゴリでは9時から15時の間にツイート数が上昇する傾向があった。キャンペーンを行っている企業やアプリなどの公式アカウントのツイートの影響と考えられる。
政治カテゴリでは5種類のツイートで同じく、9時から15時の間にツイート数が上昇する傾向があった。そのうち3種類のツイートでは同一のアカウントが投稿する時間を指定する内容のツイートがあった。あらかじめ投稿する時間を指定することでトレンド入りを狙ったものと考えられる。
商用カテゴリではキャンペーンの開始と同時にツイート数が増加する傾向が、7種類のツイートのうち5種類で確認された。
・刑事事件カテゴリとコロナカテゴリでは,ツイート数の多い時間帯と報道された時間帯がほとんど一致していた
報道による影響が如実に出ている。
結果として、意図的に操作を行っている可能性も見えてきたわけで、次のステップでは今回の知見を生かして、くわしい内容に踏み込んでいくようだ。
●感想
最初に書いたように国内のこの種の調査研究は数が少なく、カテゴリ間による傾向の違いなどがわかったのは貴重だと思う。しかも、意図的に操作が行われていた可能性もわかった。商用のキャンペーンはもともとそういうものだからよいとして、政治の分野ではどこまで意図的な操作が許されるのライン引きも今後の課題になりそうだ。
ただ、関心の高いテーマについてはリツイートの比率がきわめて高いので、この次はリツイートも含めた分析を期待したい。
また、個人的には論文中で紹介されている論文も興味を引かれるものが多く、この点でも貴重だった。
関連書籍
データ分析読解の技術 (菅原琢、中公新書ラクレ、2022年3月9日)
『フェイクニュース 新しい戦略的戦争兵器』(一田和樹、角川新書、2018年11月10日)
本noteではサポートを受け付けております。よろしくお願いいたします。