【デイトラPythonコース(応用)】TwitterAPIから自身の過去のツイートを取得してネガポジ分析をしてみた。「いいね数」と「ポジティブ度」は相関していると予想する。
こんにちは(@t_kun_kamakiri)
最近は、集中してデイトラのPythonコースを受講しています。
現在は、中級編でyoutubeAPIの申請中なので、先に進むことができず、デイトアを進むことができないので、デイトラで学んだことを応用してみたいと思います。
過去の自身のツイートをネガポジ分析する
まずは、TwitterAPIを使って過去の自身のツイート200件を取得して、ネガポジ分析してみました。
自分のポジティブ度はネガティグ度より、3倍くらいであることがわかりました。
ネガポジ分析って何という方のために、簡単な計算方法の流れを紹介しておきます。
過去の自分のツイート200件から「いいね数」と相関の大きいものを調べる
先ほどの応用で、今度は「いいね数」と相関が大きい要素は何かを調べたいと思います。
いいね数と相関がありそうなものといえば、
●RT数
●ポジティブ度
●ネガティブ度
など、があるかと思います。
ひとまずこの3つを要素として、相関図を描いてみました。
1回に所得できるツイート件数が200件までなので、サンプル数が少なく、十分なデータ量ではないので、結果の信ぴょう性が怪しいです。
このように統計学の知識が必要だなと感じました。
Pythonを使ったデータ分析の基本は以下の参考書が入門としては良いかなと思います。
サンプル数を増やしてみる
次回はサンプル数を増やして(統計量を増やす)見ようと思います。
TwitterAPIでは1リクエストで取得できるのに制限があり、APIリクエストを多く発行すると15分間のAPI制限が掛かります。
なので、15分おきにデータを取得するプログラムを書けばよいということになりますので、次回試してみようと思います。
Twitter➡@t_kun_kamakiri
ブログ➡宇宙に入ったカマキリ(物理ブログ)
ココナラ➡物理の質問サポートサービス
この記事が気に入ったらサポートをしてみませんか?