見出し画像

Twitterのフォロー情報をテキストマイニングすると、自分の興味関心事がみえてくるかもしれない

目の前のやらなければいけないことで頭がいっぱいになった時、ふと、自分が本当にやりたいことが何だったか見失ってしまった、なんて経験はないだろうか。
もし、Twitterを普段使いする人であれば、個人アカウントのフォロー情報を分析することで自分のやりたいことの片鱗が見れるかもしれない。

ただし、分析結果の精度はTwitterの使い方によっても変わってくる。
例えば私の場合。アカウントは持ってるものの、恥ずかしながら、見る専と化してる化石アカウントだ。とはいえ、今回紹介するアイデアでは、こうしたケースの方がそれなりの精度がでる可能性がある。

いまフォローしてる人にプライベートのつながりはほとんどない。
Twitterの公開アカウントを作った当初、面白かった本/記事/論文の著者や、お気に入りのPodcastの出演者の方々をフォローすることから始めた。
するとタイムラインには、フォローしてる人の投稿だけでなく、リツイートやいいねした投稿も流れるようになり、そこからまた、自分の関心分野について発信する人、価値観に共感した人、とにかく面白い人をフォローする。
気になる人のつながり経由で、新たな気になる人に出会う、というのを繰り返し、自己流にカスタマイズされた「気になるネットワーク」をどんどん拡大していく。そしてそこから得た情報や考え方を脳内にインデックスさせることで、必要な時に取り出せるようにする、みたいなことを地道に行っている。

そんな使い方をしていることから、フォローする人の傾向を分析すると、自分の趣味嗜好や興味関心事がみえてくるのでは!という期待が高まった。
私はもともとシステムエンジニアで今は人事なので、関心分野としては、開発・人事周りが色濃くでる気がしている。

さて、どうやるか

やることはいたってシンプルで、たった2つだけ。

  • GASとTwitter APIを使ってフォローしてる人の自己紹介文をスプレッドシートに書き出す

  • スプレッドシートに書き出した自己紹介文をテキストマイニングする

テキストマイニングは、以前職場で耳にしたことがあり、一度試してみたかったのでいい機会。

フォローしてる人の自己紹介文をスプレッドシートに書き出す

基本的にはこの記事を参考にすれば作れるので、実装方法は割愛する。
エンドポイントを「https://api.twitter.com/1.1/followers/list.json」から「https://api.twitter.com/1.1/friends/list.json」に変えて、スプレッドシートへの出力値にUser objectから取得したdescriptionを追加するのみ。
GET friends/listを実行するには、Developer PortalからTwitter API v2の利用申請が必要。申請時にAPIの使用方法を英語(Google翻訳レベルでOK)で書く必要があるので、その点だけ注意。
200文字くらい書かないといけず、私の場合は「とにかく分析がしたいんです!」みたいなことを冗長に書いて、なんとかした。そのくらいでなんとかなる。

出力イメージ

抽出した自己紹介文をテキストマイニング

テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である[1]。
フリー百科事典『ウィキペディア(Wikipedia)』

テキストマイニングには色々とツールがあるが、今回は「AIテキストマイニング」を使ってみる。
早速、どんなものか試してみよう。
ここ最近オフィス出社時に食べたランチメニューを解析してみる。

セブンイレブンの蒸しパンはコスパがよいのだ

出現頻度順に表示するとデータ量が少ないので、蒸しパンの主張が激しい。

本ツールの運営会社のUser Local社がサンプルとして用意した大宰治『走れメロス』の解析結果が一番イメージしやすいだろう。スコア順で表示している。

では、本題のGASで抽出した自己紹介文を解析してみる。AIテキストマイニングのフォーム欄に、スプレッドシートに出力したdescriptionの値を全行コピペし(改行は気にせずそのままペタリで問題ない)、「テキストマイニングする」をクリックすれば完了だ。

「co」と「t」が多いのは、Twitterの短縮リンク「https://t.co/~」によるものだろう。今回の分析ではノイズとなるので、除外して再度解析する。

いい感じに絞れた

さらにここから、名詞のみに絞りこむと、こんな感じだ。

ここまですると、なんとなく、自分の興味範囲や情報経路が浮き彫りになってくるので、「自分のやりたいことの片鱗をみる」という目的は果たせた気がした。

単語の出現ランキング上位

おわりに

当初の予想通り、関心分野としては、人事や開発周りの傾向が顕著にあらわれた。自分が何に興味をもっているかを"なんとなく"知りたい場合、この方法は割と有用かもと感じている。
毎日さまざまな情報に触れながら自分自身もアップデートし続けることを踏まえると、半年おきなど定期的にやってみると、関心分野にも変化がみえて面白そう。
今回はフォローする人の自己紹介文から関心のある分野を分析したが、今度は、自分がいいねした投稿をテキストマイニングしてみると、その分野の何に関心を寄せているのか、わかるかもしれないし、わからないかもしれない。
興味がある人はぜひ試してほしい。

この記事が気に入ったらサポートをしてみませんか?