note 5日目 スクレイピング 【アダルトアフィリエイト挑戦】
アダルトアフィリエイトの自動化目指して格闘中です。数日前にFANZAの商品ページの紹介文をスプレイピングするやり方を覚えたのですが、すっかり忘れてしまいました。note始めたのもそれがきっかけだったのですが…
10分くらい思い出しながらいろいろ試して、またできるようになりました。
スクレイピングは最大120件(120作品)、FANZA APIデータは100件(100作品)と書き出した数量が異なるのでVLOOKUPとかでつないでいるのですが、けっこう大変です。PythonとかGAS、あるいはVBAとか使えば簡単なことなんでしょうね。 Excelでデータまとめてますが、Excelのファイル量も大きくなってしまい重くてやりづらいです。やり方自体を変える必要もあるかもしれませんが、まずはこのまま進めてみます。
コードはこんな感じです。コード完成するまで、ChatGPTに何度も修正してもらい、一応完成しました。
このコード、私は理解してません…. じっくり勉強して理解して自分でコード書けるようになると楽しんでしょうね。
今回スクレイピングしたのは特定のジャンルのみ… それでも2400記事ほどの量になりました。
スクレイピング速度は1作品、約3秒くらいでした(実測)。速度はネット環境やPCスペックに因るかもしれません。私のPCは4年ほど前の激安PCです。
ちなみに作品紹介文にはキャンペーン情報なども一緒にスクレイピングしてしまうので、以下のExcel関数で"特集"や"-----"以降は削除することもできます。ChatGPTに教えてもらいました。ほとんど初めて使う関数です(下記の関数ではLEN関数くらいしか今まで使ったことないです)。
=IFERROR(LEFT(A2, MIN(IFERROR(SEARCH("※", A2), LEN(A2)+1), IFERROR(SEARCH("----", A2), LEN(A2)+1), IFERROR(SEARCH("特集", A2), LEN(A2)+1)) - 1), A2)
FANZAサイト→ Chromeでスクレイピング→Excelに書き出し→上記関数で体裁整える→FANZA APIデータとVLOOKUP(HLOOKUPも)で下書き作成(Excel)→ワードプレス、といった流れですが、非常にざっくりでわかりにくくてすみません。
今は作業時間がかなりかかってます。プログラムもミスが多かったり失敗も多いですが、完成すれば100記事も1000記事もさほど時間は変わりません。
大量記事作成のツールとしてのプログラムですが、稼げるかどうかはまた別のことなんでしょうね。
この記事が気に入ったらサポートをしてみませんか?