見出し画像

【デイトラPythonコース(応用)】TwitterAPIから自身の過去のツイートを取得してネガポジ分析をしてみた。「いいね数」と「ポジティブ度」は相関していると予想する。

こんにちは(@t_kun_kamakiri

最近は、集中してデイトラのPythonコースを受講しています。

現在は、中級編でyoutubeAPIの申請中なので、先に進むことができず、デイトアを進むことができないので、デイトラで学んだことを応用してみたいと思います。

過去の自身のツイートをネガポジ分析する

まずは、TwitterAPIを使って過去の自身のツイート200件を取得して、ネガポジ分析してみました。

自分のポジティブ度はネガティグ度より、3倍くらいであることがわかりました。

ネガポジ分析って何という方のために、簡単な計算方法の流れを紹介しておきます。

過去の自分のツイート200件から「いいね数」と相関の大きいものを調べる

先ほどの応用で、今度は「いいね数」と相関が大きい要素は何かを調べたいと思います。

いいね数と相関がありそうなものといえば、
●RT数
●ポジティブ度
●ネガティブ度
など、があるかと思います。

ひとまずこの3つを要素として、相関図を描いてみました。

1回に所得できるツイート件数が200件までなので、サンプル数が少なく、十分なデータ量ではないので、結果の信ぴょう性が怪しいです。

このように統計学の知識が必要だなと感じました。

Pythonを使ったデータ分析の基本は以下の参考書が入門としては良いかなと思います。

サンプル数を増やしてみる

次回はサンプル数を増やして(統計量を増やす)見ようと思います。

TwitterAPIでは1リクエストで取得できるのに制限があり、APIリクエストを多く発行すると15分間のAPI制限が掛かります。

なので、15分おきにデータを取得するプログラムを書けばよいということになりますので、次回試してみようと思います。

Twitter➡@t_kun_kamakiri
ブログ➡宇宙に入ったカマキリ(物理ブログ)
ココナラ➡物理の質問サポートサービス

この記事が気に入ったらサポートをしてみませんか?