見出し画像

ebay検索情報からamazonで必要情報を検索するツールの話

お疲れ様です。
最近コツコツ記事をまた書き始めました。
以前投稿した以下記事の続きです。

上記記事から、今回はCANONのカメラを検索かけて、amazonでその製品の情報を引っ張ってこられるかツールを作成中です。
まずは、前回の記事からebay情報をまとめCSVに落とした情報をpandasに
移動。dataframe化。
ついでに、dataframe化したリストから、titleの項目のみ抽出。
(実際、UPSがいいのか、商品タイトルでAMAZONで検索すればいいのか、まだ模索中。)
やりたいことは、検索した製品を見つけて、そこのASIN情報、重量、梱包サイズを自動で抽出したい。

path = r"C:\Users\Owner\Desktop\work_current\sorce\ebay.csv"
df = pd.read_csv(path)

df0A = df['title'].dropna()
UPClist = []
for i in df0A:
    #if i.isdigit() == True :
    UPClist.append(i)
UPClist = sorted(set(UPClist), key=UPClist.index)

amzonで検索。
最近は、Javaで動くサイトも、動かないサイトも、seleniumで普通にとってこられるようになった。スクレイピング技術が向上したのかな?
今回は、listからお試しで最初の1つだけ検索するため、
for 文あとにbreak追加で一回でおしまいにしている。

#print(UPClist)
url = 'https://www.amazon.co.jp/'
#gazo = [["title","cost",'sold','UPC']]
options = webdriver.ChromeOptions()
#options.add_argument('--headless')
driver = webdriver.Chrome(options=options)
driver.maximize_window()
driver.get(url)
driver.execute_script("""delete Object.getPrototypeOf(navigator).webdriver;""")
time.sleep(2)
element = driver.find_element(By.XPATH, '//*[@id="twotabsearchtextbox"]')
element.click()
for i in UPClist:
    element.clear()
    element.send_keys(i)
    element = driver.find_element(By.XPATH, '//*[@id="nav-search-submit-button"]')
    element.click()
    break

今回は、「"Canon EOS 2000D DSLR Camera With EF-S 18-55 mm f/3.5-5.6 IS III Lens, Black"」で検索。

検索画像。

順調なのか?ここから特定条件を集めたいが、いまいちまとまらず模索中。
まぁゆっくりやるか。

この記事が気に入ったらサポートをしてみませんか?