見出し画像

【維持費0円】Xのアカウントから動画をごっそり自動収集するpythonスクリプト

皆様ハロー、スクリプトは書けるけど使いこなすのがヘタクソなスマイルです('ω')ノ

今回はバズった動画をXからごっそり収集するシンプルpythonスクリプトを作ってみました。一部のクリエイターの方にはぶっ刺さる内容に仕上がっていると思います。

記事が面白かったらフォロー&♥よろしくお願いしますm(_ _)m


仕上がりはこんな感じ

収集先のアカウントさえリストになっていれば、10分で500本くらい動画を集められると思います。

仕組み

中身自体は簡単な構造になっておりまして、

  • ポストに添付された動画をダウンロード

  • 動画の重複チェック

  • 再生時間ごとに分類

の3本立てになっています、仕組みの中で工夫した部分は次の通り。

データ収集にtwikitを採用

twitterAPI使ってツイートデータを取得するには最安でも月額$100の費用が掛かってしまいますが、pythonのサードパーティライブラリである"twikit"を使う事で、無料でツイートデータの収集が可能になります。

その分リスクなどはありますが、その辺は下記の記事にまとめましたので興味のある方は読んでみて下さい。

つまり、当pythonスクリプトを使うためにはXのアカウントが必要になりますんで、事前に用意する必要があります。

重複動画の自動チェック

複数のまとめ動画系のアカウントから収集すると、転載に次ぐ転載で同じ動画が複数取得される事がよくあります。

どんな用途で使うにしても同じ動画は1個でいいと思うので、類似度を計算して動画の重複をチェックしダブっているコンテンツは自動で削除する機能をつけておきました。

スピードと軽さを重視したので精度は75%くらいです、チューニングすれば精度が上がるかもしれませんがこれくらいでも十分便利でした。重複チェックって数が多くなるほど手動はキツくなるので、地味に便利機能です。

動画のボリュームで分類

実際にこの仕組みで動画を収集すると、数秒で終わる動画もたくさん収集されるので動画のボリュームごとにフォルダを作り分類する機能を付けておきました。

例えば5秒刻みで分類したサンプルはこんな感じに。

"最低でも10秒以上の動画だけを利用したい"など、利用者によってニーズが異なると思うので何秒刻みで分類するかも簡単に指定できるようになっています。

動画コンテンツのマネタイズ

YouTubeにはアカウントを収益化しなくても動画の再生回数をお金に換える裏技が存在しておりまして、当記事の動画収集スクリプトと組み合わせる事でとんでもないパフォーマンスを叩き出す事も可能です。

楽してガッポリ稼ぎたい方はぜひ読んでみて下さい。

コピペスクリプトはこちら

pythonファイルは次のように構成されておりまして、python環境にコピペしてmain.pyを実行すれば動きます。

  • main.py(実行ファイル)

  • get_videos.py(動画のダウンロード)

  • duplicate_check.py(重複チェック)

  • classify_videos.py(再生時間別に分類)

【main.py】

ここから先は

8,374字
この記事のみ ¥ 990

よろしければサポートお願いします、頂いたサポートは活動費として使用させて頂きより有意義な記事を書けるように頑張ります!