見出し画像

python beautifulsoup基礎 find select

responseオブジェクトを取得した後は、htmlのタグ、idやclassなどを使用して取得したい情報を指定します。

htmlやcssの基礎知識はある程度必要。

情報を取得する際に、findメソッドとselectメソッドがあるけど、この二つの違いに関する説明

soup.find_all("a", href="sample.pdf")
soup.select("a[href='sample.pdf']")

細かい違いはわからんが、どうやら、findはhtml要素名に続いて、属性を指定する記法で、selectはcssセレクタを使える。ただ、cssセレクタに関して詳しくないので、使い分けムズイわ。

ちなみに、findは一つだけ、もしたくさん欲しいなら、find_all。selectの場合は、一つだけほしい場合はselect_one。なんでこんな仕様にしたんやわけわからん。

この記事が気に入ったらサポートをしてみませんか?