Pythonライブラリ(Webスクレイピング):Helium
1.概要
インターネットを経由して情報を取得する技術をスクレイピングと言います。ライブラリとして有名なのはSeleniumとBeautiful soupですが要素取得が手間です。今回は要素取得が簡単に使用できるHeliumを紹介します。
pip install helium
2.Heliumの要素取得方法
Heliumの特徴として、デベロッパーツール使用やHTML構造解析をしなくてWeb画面に見えている文字を直接指定することで要素を取得できます。
[In]
from helium import *
import time
url = 'https://note.com/sitesettings/stats'
driver = start_chrome(url, headless=False) #Chromeを立ち上げ
write('KIYO', into='mail@example.com or note ID') #heliumでメールアドレスを入力
driver.find_element_by_id('password').send_keys('password') #seleniumのAPIでパスワードを入力
click('ログイン')
3.Heliumの使用方法
下記記事が非常に体系的にまとめられており参考用としても優秀です。
私がよく使う処理は下記ですが詳細な説明は上記記事をご参照ください。
4.エラー事例
Heliumでよく生じたエラー事例は下記の通りです。
あとがき
heliumだけだと要素の取り方がわからないことも多いのでseleniumのAPIと合わせて使用していますが非常に便利だと思います。
この記事が気に入ったらサポートをしてみませんか?