見出し画像

ebayで販売中のポケモンカードの価格を一覧化できるシステムを作った話。

本日は、題名通りです。最近ポケモンカードの転売が著しく。
メルカリなどの転売サイトで情報を仕入れる人たちが多いですね。
こんなところにも目を付けた、ウェブスクレイピング野郎がここにいます。
どうも、私です。こんばんは。

連日、pythonでスクレイピングのコードを書いてはnoteに記載しています。
本日は、コード書くのは正直嫌なので、
結果だけを記事にしようかと思います。正直、ここら辺お金が絡む話なので。ここら辺、気になる人は、個別で連絡ください。有償で相談に乗りたいと思います。

はい、では冒頭のコードだけ記載しようかと思います。


import requests
import urllibfrom bs4 
import BeautifulSoup
import csvimport pandas as pd
from urllib.request import urlopen
import timefrom datetime 
import datetime,timezone
import osimport openpyxlfrom PIL 
import Imageimport io
import matplotlib.pyplot as pltfrom PIL 
import Imageimport globimport re

def Main(url):'''Entry Point.

Args:
    url:    target url.
'''
pagenation =[] #url  = url+"page/"
num = 1
while num <= 2:
    url1 = url+ str(num) 
    print(str(url1)+'を解析中')
    try:
        html = urlopen(url1).read()
        soup = BeautifulSoup(html, features="html.parser")
        soup1 = soup.find(class_="pagination__items")
        soup2 = soup1.find_all("a")
        for href in soup2:
            href = href.get("href")
            pagenation.append(href)
            time.sleep(1)
    except urllib.error.HTTPError as e:
        print("すべて確認済み")
        print(pagenation)

        break
    num += 1

pagenation = sorted(set(pagenation))
print("ページ掌握完了、これよりデータ収集に移る")
以下略(笑)

はい、上記コード使えば、こんな状態(ebayに記載されている画像、その価格まで丸裸です。)
ぶっちゃけ、このコード使えば、基本的にebayに乗ってる情報はすべて
持ってこれちゃいます。ポケモンカードは偶々です。
画像と、価格と、その購入ホームページまでここに全部乗っけちゃいました。

エクセル記載情報

そんでもって、ポケモンカード1996年で検索した結果のうち、
ダブりを除くイメージ画像もすべて、一つのフォルダに番号までつけて保管できちゃいます。(今回ページ数としては2ページまでとしました。)

画像データ収集結果

参考に、今回のoutputを載せておきます。悪用厳禁。ebayの情報をすべて
丸裸としました。


この記事が気に入ったらサポートをしてみませんか?