noteのビュー数などを自動取得できるようにしてみたけど、ルール上ダメなようですね。。

2020年4月22日 23:42

noteを毎日投稿していて、
日々のビュー数ってデータ残らないのかな、とか、
ダッシュボードの数値を毎日自動で取得してくれないかな、
とか思って過ごしていました。

今月はPythonの学習を始めたので、
試しに作ってみました。

結論としてはダメなようです。

これは需要がありそうだから、
有料記事にしてみるかなーとか思っていたのですが、
そもそもダメなようですね。
ガーン。。

こちらのページがわかりやすかったです。

webスクレイピングなどでwebサイトをクローリングする際に行わなければならないことの一つに「robots.txt」の記載内容の確認が挙げられます。
ここではnote.comのrobots.txtについて実際にどの様に記載されているのか読み解きながら、その内容を確認していきたいと思います。
（中略）
「ログインした状態でないと見れない個人用のページ」や「運営管理用と思われるページ」が拒否設定となっているみたいです。

成果物はこんな感じです。

いちおう作ったものの成果物を載せておきます。

１．noteのダッシュボード「全期間」の記事を１件別に取得。
イメージはこんな感じです。

スクリーンショット (820)

２．毎日定期に実行

毎日定時に動きます。
保存されるcsv名にはcsvを出力した日付と時間(秒単位)を指定しています。

イメージはこんな感じです。
処理を実行したpythonファイルと同じ階層に保存されます。

スクリーンショット (817)

主にPythonのseleniumというツールを使いました。

つらつらと書いたものの、だめなものはだめですね。

Python便利だなぁって感じでした。
コードが動くと嬉しいですね。
今回は残念でしたが、課題がたくさん見つかったので、
少しずつ学んでいこうと思います。

この記事が気に入ったらサポートをしてみませんか？