PythonでRedditのwallstreetsbet(WSB)に投稿されているコメントを抽出する方法

昨今ニュースを騒がせているように、米国の4chan的な位置づけにあるRedditというwallstreetsbet(WSB)というスレッドでは日夜投資について議論が交わされているが、このWSBが結託して一部個別株を大幅に買い上げて空売り屋にダメージを与えたり、ボロ株を暴騰させたりと注目を浴びている。

<参考記事>
ゲームストップ株を巡る前代未聞の空売り屋踏み上げ事件

<RedditのWSBコミュニティ>
wallstreetbets - Reddit

そのため、投資分析においてこのWSBでどのような会話がなされているかを見るというのが一つ投資分析としてやや注目されている。

今回はこのRedditのWSBからPythonでコメントを抽出するという、分析の前の基本的なデータ取得はどのように行うかを解説したい。

なお、Redditのデータ抽出方法としてBeautiful SoupとかSeleniumとかを使ってスクレイピングするというやり方もあるが、スレッドやコメントがバンバン大量に更新される中でそんな眠たいことしてると全然追いつかないということがあるので、別の方法を使用することになる。

今回使用するコードを使うと下記のようにRedditのWSBから最新コメントを取得することができる。(諸事情で最大1000件までの模様)

<WSBからコメントを取得し、html出力した結果の一部>

タイトルなし

上記はPythonで抽出したRedditのWSBのコメントをhtml出力させた結果の一部になる。これをエクセル出力させることも可能で、一度Pythonで取得すれば様々な形でこの取得したデータを出力・加工することができるだろう。
では今回の解説になります。


ここから先は

3,089字 / 3画像

¥ 450

この記事が気に入ったらサポートをしてみませんか?