見出し画像

初心者がtwitterのタイムラインの単語出現頻度を可視化する。[Python]

Twitterのライムラインにはマーケットに参加する人たちの欲と恐怖が現れるといわれています。上昇時には強気な言葉が並び、下落時には弱気な言葉並ぶのでしょうか。自分のtimelineをpythonのWord Cloudライブラリを使って単語の出現頻度を可視化をしてみました。以下が結果です。

逆イールドのニュースが出る前のデータですが、自分がフォローさせていただいているユーザーさんの興味関心が表れているかな、、という結果です。


フォローさせていただいているユーザーさんのプロフィール欄の言葉で可視化をかけた結果は以下の通りです。

投資、FX、先物、トレード、経済、金融、報酬、勉強、研究 などに興味持たれている方をサポートさせていただいているのが分かります。金融関係にユニバースが絞られている・絞っているのが視覚的に分かります。


実は以前、似たような事をやったことがあるのですが、その時は文節くぎりとか単語の品詞分解のモジュールの「MeCab」(形態素解析エンジン)がうまく使えなくて、途中で挫折してしまいました。今回は「janome」を用いての単語分割にしたのですが、思いのほか簡単にできて、前もこれを使えばよかった。。。と思っている次第です。

ただ、それ以外にも

・金融のセンチメントを測るなら英語でやるべきではないか。 
・雨が降れば、傘は売れるが、傘が売れたからといって、明日雨が降るかはわからない。

(金融危機が起これば不安なつぶやきが増えるが、不安なつぶやきが増えたからといって、金融危機が起こるとは限らない。)

という理由で、あまり深くはやりませんでした。ただ、少し、思うこともあり、再度やってみるかなと思った次第です。

という、気持ちでいっぱいですが、汗、ちょっと面白いことでもわかるといいなと思っています。


もし役に立った、もっと知りたい、ほかの人にも伝えたい!と思えたら、このnoteのフォローと、ツイッターで@AnalyseTfフォローしてくれるととてもうれしいです!

###追記分###
pythonで資産運用モデルを作成する記事をまとめました。もし興味を持っていただけるなら読んでみてください。



サポートしていただき大変ありがとうございます。 励みになります。