見出し画像

PythonでニュースメディアやブログのRSSから特定の記事だけを一覧する方法【期間、文字列指定】

Pythonを使って、ニュースメディアやブログ、noteのRSSから、指定した期間内で特定の文字列が含まれる記事だけを収集して一覧する方法を紹介。いわゆるスクレイピング

誰でもできる。Python超初心者の僕でもできた。

例えば、「日経新聞」に掲載された「昨日と今日」の記事のうち、記事タイトルと概要文に「Amazon」という文字列を含む記事を一覧できるようになる。

●RSSを発行しているニュースサイトやブログなら対応可能。
●今日を基点に過去何日分遡るかを指定可能。
●文字列はいくつでも指定可能、1つでも含まれていたら収集する。

feedlyなどのツールだと、RSSを登録するとそのメディアの全記事が並んでしまい、見たい記事を探すのが難しくなる。今回紹介するプログラムを使えば、自分の関心がある記事だけを拾えるようになって最高。

毎日、または2日に1回など、気になるメディアで掲載された記事をチェックしたい場合に利用すると非常に便利。

【目次】
Pythonをインストール
Visual Studio Codeをインストール
Pythonファイルを格納するフォルダを作る
ライブラリのインストール
コードを書く
コードの解説
プログラムを実行する
情報収集は完璧

※2019年1月末まで動作確認済み。

ここから先は

3,856字 / 2画像

¥ 1,500

ここまで読んでいただき、ありがとうございます! もしよかったらスキやフォローをよろしくお願いします。