初心者がtwitterのタイムラインの単語出現頻度を可視化する。[Python]

2019年3月25日 06:59

Twitterのライムラインにはマーケットに参加する人たちの欲と恐怖が現れるといわれています。上昇時には強気な言葉が並び、下落時には弱気な言葉並ぶのでしょうか。自分のtimelineをpythonのWord Cloudライブラリを使って単語の出現頻度を可視化をしてみました。以下が結果です。

逆イールドのニュースが出る前のデータですが、自分がフォローさせていただいているユーザーさんの興味関心が表れているかな、、という結果です。

フォローさせていただいているユーザーさんのプロフィール欄の言葉で可視化をかけた結果は以下の通りです。

投資、FX、先物、トレード、経済、金融、報酬、勉強、研究　などに興味持たれている方をサポートさせていただいているのが分かります。金融関係にユニバースが絞られている・絞っているのが視覚的に分かります。

実は以前、似たような事をやったことがあるのですが、その時は文節くぎりとか単語の品詞分解のモジュールの「MeCab」（形態素解析エンジン）がうまく使えなくて、途中で挫折してしまいました。今回は「janome」を用いての単語分割にしたのですが、思いのほか簡単にできて、前もこれを使えばよかった。。。と思っている次第です。

ただ、それ以外にも

・金融のセンチメントを測るなら英語でやるべきではないか。　
・雨が降れば、傘は売れるが、傘が売れたからといって、明日雨が降るかはわからない。
（金融危機が起これば不安なつぶやきが増えるが、不安なつぶやきが増えたからといって、金融危機が起こるとは限らない。）

という理由で、あまり深くはやりませんでした。ただ、少し、思うこともあり、再度やってみるかなと思った次第です。

という、気持ちでいっぱいですが、汗、ちょっと面白いことでもわかるといいなと思っています。

もし役に立った、もっと知りたい、ほかの人にも伝えたい！と思えたら、このnoteのフォローと、ツイッターで@AnalyseTfフォローしてくれるととてもうれしいです！

###追記分###
pythonで資産運用モデルを作成する記事をまとめました。もし興味を持っていただけるなら読んでみてください。

サポートしていただき大変ありがとうございます。励みになります。