駆け出し複業家・副業人・フリーランス等々に最適なツールやサービス.06
飲食店やったり、紐売ったり、ECやったり、WEBデザインしたり、たまにアプリ作ったり、チラシとかパンフレットも作りながら、業務効率の相談に乗って、マーケティングや広告代理店もやる、しょぼい建築家です。
ここまで6回目ですが、なんか足りないなーと思いちょっと内容を変えて行こうかと思い始めてきました笑
ということで
まず
1.ツール概要
2.所感
3.価格
4.必要な知識
辺りを書いていこうかなと思います。
1.Octoparse
このツールも便利だなーと思います。
スクレイピングと呼ばれる、webから自動的にデータを抽出する技術が入ったツールです。
今までならPythonを使ったりして、Botを構築していくのが普通でしたがこれはその技術をSaaS化しているので非常に良いツールです。
2.所感
元々が日本語圏ではないので、日本語がちょっと弱いですが、それ以外はそこまで不自由なく使うことが出来ます。
ただ、痒いところに手が届かないと言う事はありますが、それでも無駄にリスト化に工数を掛けていた事を自動的に処理することが出来ます。
ただ、ウェブスクレイピングをする時に気をつけなくちゃいけないのが
アクセスを短時間に行うので、サーバー側から拒否されると言うか、そのツールのせいでサーバを落としてしまう可能性があるということです。
更にスクレイピング行為事態を利用規約で禁止にしているサイトもよくありますので気をつけて下さい。
3.価格
基本的には無料で使うことが出来ます。
無料
取得ページ数無制限
インストール台数無制限
データエクスポート10,000レコード/回
並行ローカルタスク数* 2
作れるタスク数 * 10
$75 / 月
取得ページ数無制限
インストール台数無制限
データエクスポート無制限
並行ローカルタスク数無制限
作れるタスク数 * 100
並行クラウドタスク数 * 6
定期実行可能
自動IPローテーション
タスクテンプレート
APIアクセス
$209 / 月
取得ページ数無制限
インストール台数無制限
データエクスポート無制限
並行ローカルタスク数無制限
作れるタスク数 * 250
並行クラウドタスク数 * 20
定期実行可能
自動IPローテーション
タスクテンプレート
Advanced APIアクセス
タスクチェック無料、1対1トレーニング
となっています。
4.必要な知識
Xpathへの理解とhtmlの理解はあった方が使いこなすまでには時間がかかりません。
でも、まぁ無いからと言って使えないわけではないので、やってみても良いと思います。
後は、IPとサーバー側への理解も入ります。
サーバー側へ負担を掛けないコール数や処理等を設定しないと、本当にやっちゃダメです。
https://ja.m.wikipedia.org/wiki/岡崎市立中央図書館事件
過去にはこんな事件もあります。
まぁでも、それはコードを走らせた場合でありますし、今は不正アクセスの検知だったり、サーバー側のスペックも上がってるんで
そこまでビビらくても大丈夫です笑
ただ、そういう怖いことがあるよ!って事は理解しておいてください!
5.売り方
スクレイピングツール使えますだと
たぶん売れません。僕が使うのは営業リスト買ってるの作りますよーとかです。
既存のリストよりも安く作れますって言うのでコストメリット提示してやってます。
よろしければサポートよろしくお願いします!地域活性のエンタメに使わせていただきます!