フォロワー10万人への道 その4
トップ画像は2024/10/31 11時時点でのフォロー・フォロワー数です。
現状の整理
要改善点
無駄なフォロー試行
フォロー済みのユーザを再フォローしようとする無駄なアクセスが多発中。パッと見、「has been followed」より「is existing」が多い。1秒~3秒で1名フォロー試行という速度感。
マイページからフォロー済みユーザリストを抽出して保持し、差分のみ抽出してからフォロースクリプトを動作させるなど。
フォロー時の速度
Seleniumを捨てる。Playwright等で並列処理。一応、コンソール複数立ち上げれば、並列処理にはなる。都道府県ごと並列処理すればそこそこ行けそう。
新たなフォロー対象抽出方法
参考になったを良く押しているユーザの抽出方法を考えてみる。
リモート開発
現状、持ちあるきNotePCが実行環境。移動中に数時間かかるスクリプトの稼働ができないのでどうにかしたい。常時接続の自宅のPCで稼働させるか、クラウドでの稼働かの2案。
自宅PCを実行環境にする
追加コストゼロだが、現状の環境では、クロスパスで自宅サーバを公開できないので外出先からコントロールできない問題あり。解決するには、ルータのオープンソースなファームでの書き換え、高額なルータの購入、ルータのカスケードがある。
バッファロールータのファームをOpenWrtに書き換えてipv6とipv4の共存を目指す
今動いているルータを一時的にでも使用不可にするリスクあり
中小企業向けなルータを買う
こちらの記事で紹介されているものは5万円台で購入可能
IPv6ルータの内側にIPv4ルータを置く
すでに確保しているが、WLAN強化のために使用を考えていたので、両立するにはレイアウトの問題がありそう(20mぐらいのLANケーブルの取り回し)
クラウド
IaaSかSaaSか。お手頃なものはあるのか。
IaaS
EC2、各社VPS
電源ONで放置したり、契約しっぱなしで使わなかったりして、無駄課金が怖い(AWSやVPSでもやらかした経験あり)
サーバレス(SaaS)
GoogleColabはセッションが90分以上きれたからか、取得したデータ全削除になっててダメだった。なんだか使いにくい。Jupyterが嫌い。(ipython-notebook時代から嫌い。会社がロースペックのPCを割り当ててくるので、重すぎるAnacondaも嫌いになった。その頃V2とV3の情報がカオスだったPython。R+Rstudio派だったので。月次業務レポートも卒論もknitr->latexで自動生成してた。まさかこんなにPython流行るとは)
実行環境ではなかった。コード書くだけ。
まとめ
どのみち、謎の売り物・借り物で作ったアントラストなIoTのセキュリティ(SESAMI、NatureRemo、スマホのペットカメラ運用中)のセキュリティが心配で、完全DIYで構成したい。長らく動作しているmotionの監視カメラ画像も外から見たいし、クロスパスでのサーバ公開問題を乗り越えなくてはならない。プログラミングの改良とは別のレイヤーの話になってしまったのはインフラ屋のサガで、あれこれ気になりすぎるADHD気質は、100%マーになれないのでコード書くのがなかなか上達しないのが悩み