note 5日目 スクレイピング 【アダルトアフィリエイト挑戦】

アダルトアフィリエイトの自動化目指して格闘中です。数日前にFANZAの商品ページの紹介文をスプレイピングするやり方を覚えたのですが、すっかり忘れてしまいました。note始めたのもそれがきっかけだったのですが… 
10分くらい思い出しながらいろいろ試して、またできるようになりました。

スクレイピングは最大120件(120作品)、FANZA APIデータは100件(100作品)と書き出した数量が異なるのでVLOOKUPとかでつないでいるのですが、けっこう大変です。PythonとかGAS、あるいはVBAとか使えば簡単なことなんでしょうね。 Excelでデータまとめてますが、Excelのファイル量も大きくなってしまい重くてやりづらいです。やり方自体を変える必要もあるかもしれませんが、まずはこのまま進めてみます。

コードはこんな感じです。コード完成するまで、ChatGPTに何度も修正してもらい、一応完成しました。


スクレイピングのコード

このコード、私は理解してません…. じっくり勉強して理解して自分でコード書けるようになると楽しんでしょうね。

今回スクレイピングしたのは特定のジャンルのみ… それでも2400記事ほどの量になりました。

スクレイピング速度は1作品、約3秒くらいでした(実測)。速度はネット環境やPCスペックに因るかもしれません。私のPCは4年ほど前の激安PCです。

ちなみに作品紹介文にはキャンペーン情報なども一緒にスクレイピングしてしまうので、以下のExcel関数で"特集"や"-----"以降は削除することもできます。ChatGPTに教えてもらいました。ほとんど初めて使う関数です(下記の関数ではLEN関数くらいしか今まで使ったことないです)。

=IFERROR(LEFT(A2, MIN(IFERROR(SEARCH("※", A2), LEN(A2)+1), IFERROR(SEARCH("----", A2), LEN(A2)+1), IFERROR(SEARCH("特集", A2), LEN(A2)+1)) - 1), A2)

FANZAサイト→ Chromeでスクレイピング→Excelに書き出し→上記関数で体裁整える→FANZA APIデータとVLOOKUP(HLOOKUPも)で下書き作成(Excel)→ワードプレス、といった流れですが、非常にざっくりでわかりにくくてすみません。

今は作業時間がかなりかかってます。プログラムもミスが多かったり失敗も多いですが、完成すれば100記事も1000記事もさほど時間は変わりません。

大量記事作成のツールとしてのプログラムですが、稼げるかどうかはまた別のことなんでしょうね。


この記事が気に入ったらサポートをしてみませんか?