新型コロナとツイート感情分析~3連休で本当に皆油断していたかどうか調べてみた

新型コロナ関係のツイートをひたすら集め続けて2か月以上経過して,データもだいぶ充実してきました.共同研究者にも配布を始めたのですが,どうもデータ収集サーバのTimeZoneが狂っていたらしく,時間については信用できないデータになっていたので,一生懸命再構築中.とほほ.

さて,基本的にNLP(=自然言語処理)は苦手なんですが,新型コロナに関する感情がどのように変化しているのかを調べてみました.

結論から言えば,
先週末の連休で皆油断しているといわれていたけど,やっぱり油断してた.今はちょっと緊張感を取り戻しつつある気がする.

使ったデータは「新型肺炎 OR 武漢 OR コロナ(ウイルス OR ウィルス) OR コロナ OR ウイルス OR ウィルス OR COVIT19 OR COVIT-19」で検索したツイート1月16日~3月26日までのリツイート以外の18,471,700件.リツイートじゃないツイートに含まれている感情が生の情報だろうという仮定から.というか,最後に書いているけど,RT入れるとバズりの効果がでかすぎて何もわからないw

そもそも感情分析ってあんまり優れた手法がないようで,手軽に精度よくやるためのデファクトスタンダードがぱっとは見つからない.ポジネガ判定ですら苦戦しているところもあるようで,2000万件のツイートを実時間で判別するのは難しい?自然言語処理に詳しい人がいたらよい手法を教えてください.

さて,そんななかなんとか感情分析をやる方法として目を付けたのが,ML-Ask.詳しくはこちら
http://arakilab.media.eng.hokudai.ac.jp/~ptaszynski/repository/mlask.htm
を見てもらうとして,Pythonでの実装があるので,githubからさくっともらってきて,18,471,700件分かけてみました.

ML-Askでは10種類の感情が判別できるが,関係なさそうなのは省いて,怒,厭,怖,安,喜だけを対象として,ある時間から24時間以内のツイートに各感情が含まれる回数をカウント.その後,全ツイート(RT除く)における割合を算出してみます.その結果がこちら.

画像1

ざっくりとした傾向を見ると,1月から2月の当初は,「怖」の感情が特に多いです.その後,「厭」が増加しています.どうやら最初はとにかく怖がっていたが,今はどちらかというとコロナウィルスがもたらす状況への嫌悪感が増加しているといった感じでしょうか.政府に対する怒りの感情とか結構出ているのかと思ったけど,そんなことはなかったですね.RTだとちょっと違う傾向が出そうですが.

さて,興味深いのが「喜」の感情.当初はあまり多くなかったが,徐々に増加して,3月頭くらいに恐怖の感情を超えています.なんだろう.

さてここからが本題.ちょうど3連休あたりで皆が油断していたのではないかという話があったけど,このグラフを見ると,確かに3連休(3/20-22)付近で「怖」の感情は1月以来最小となってなり,少し油断しているのではないかという様子が見て取れます.

3月26日に,首都圏各都県には外出自粛要請が出たわけですが,それを受けてか26日のデータでは再び「怖」が「喜」を超えて増加しています.まだこれからなので確かなことは言えないですが,油断していたのが少しまた緊張に傾いているのかもしれないですね.

新型コロナが一体何だったのかは数年後にならないとわからないことなので,今どうすべきなのかの正解は神様しか知らないことです(某宗教団体とか見ていると神様も知らないんじゃないか?とか勘繰りたくなるけど).
とはいえ,イタリアやスペインの状況を見ているとあまり油断しすぎるのはよくないようにも思えるわけで,花見だ入学式だ,と浮かれる場合も油断せず,数年後に「日本は新型コロナの蔓延を防いだ」と自信を持って言える状態にしておきたいものです.

さて,というわけで,今回は苦手でな自然言語処理にも挑んで(挑んだといえるのか?)感情分析をやってみました.今感情の分析をもうちょっと精度よくやるために共同研究者の電通大の稲葉先生と計画中です.
もし,「俺ならもっとうまくやるぜ!」という方がいたら共同研究者を募集中なので,ぜひお声がけください.


あ,ちなみにリツイートも全部入れて7000万ついーとを分析するとこんな感じになります.

画像2

バズったリツイートの影響が大きすぎてよくわからなくなりますね.さて,この辺もどうしたものか.

追記:「NLPは神経言語プログラミングだよな!?」という突っ込みが多かったので,自然言語処理に書き換えてやったぜ.神経言語プログラミングが得意な人でも一緒に研究できるなら歓迎だけどw

この記事が気に入ったらサポートをしてみませんか?