見出し画像

【Python】AmazonのASIN(ISBN-10)取得する方法

※過去の記事を再投稿しています


概要

AmazonのURLからASIN(ISBN-10)を取得可能です

現在は米国(www.amazon.com)も日本(www.amazon.co.jp)も同様に

URL内にASIN(ISBN-10)が表示されています

dp/XXXXXXXXXX/

XXXXXXXXXX がASINになります

 スクレイピングで商品のURLを取得し、URLから以下の方法でASINを取得できます

Pythonソースコード

url = '[amazon url]'

print('ASIN:'+url[url.find('dp/')+3:url.find('dp/')+13])


解説

url.find('dp/')

 「dp/」の位置を取得しています

url[n:m]

 部分文字列を取得しています

url[url.find('dp/')+3:url.find('dp/')+13]

 ここでは上記で取得した、「dp/」の位置から10文字取得したいので、「dp/」の位置+3から「dp/」の位置+13までを取得します

print('ASIN:')

 printは標準出力に表示する関数です


所感

 実際には、BeautifulSoup4やSeleniumを組み合わせて、商品を検索して検索結果のページからURLを取得し、ASIN(ISBN-10)を取得します


いいなと思ったら応援しよう!