SNS上で音楽共有を行うユーザの特性についての分析[Spotify×Twitter](#1)
こんにちは,Shimasan(@shimasan0x00)です.
私はSNS上に発露するユーザの特性について興味があり,色々とデータを集めて分析したりしています.今回の分析はずっと前から関心領域ではあったものの手をつけずにいたものの一つです.
これは私自身が音楽をあまり嗜むことがないからこそ強く思っていたことなのかもしれませんが,SNS上で音楽を共有するのってどういう意図があるんだろうと考えてたことが始まりです.
私のTwitterネットワークでも音楽の共有,特にSpotifyのリンクが付与された音楽共有ツイートが時々流れてきます.
たまたまSpotifyで聞いていた音楽が凄く良くてみんなに知ってほしいので共有するという心理はわかるのですが,多くのユーザは別のプラットフォームにまでわざわざ共有するでしょうか.
もちろん,音楽がいいから共有するという意図の他に自分はこのような音楽を聞いています,このSNS上で同じような音楽に興味がある人はいないだろうかという意味を込めて共有することも考えられます.
しかし,どのような意図があるとしてもわざわざSNS上に音楽を共有するユーザというのは特別であり,そのようなユーザ群の特性や聞いている音楽のジャンルや曲の傾向は偏りがあるのではないでしょうか.
この分析ではそのようなユーザの特性を明らかにし,SNS上に流通する音楽傾向の偏りがあるか調査することを目的とした分析です.
分析の流れ
- Twitter上で流通する曲の特徴について明らかにする(今回はココ)
- Twitter上で音楽共有を行うユーザの特性について明らかにする
使用するデータ
TwitterのSpotifyの音楽共有を行ったツイートデータと共有された音楽の特性を得るためにSpotifyの音楽メタデータを使用します.
TwitterのデータはAPIを用いて収集し,11/2日に「open.spotify.com/track」を含むツイートをした165,465ツイートを対象にします.
また,それらのツイートで言及された157,592曲の中で2回以上共有された19,612曲をSpotifyのAPIを用いて音楽のメタデータやアーティストの情報を収集しました.
以降,音楽ジャンルの話をする際のジャンルは曲に付与されているものではなく,その曲を提供したアーティストに付与されているものですので留意してください.
なお,Spotifyのデータを集める際は公式でも紹介されていたPythonのライブラリであるtekoreを使用しました.
分析結果
音楽ジャンル
まずは多く共有された音楽ジャンルについて見ていきましょう.
ジャンルとして1602得られました.
Spotifyのgenre-seedsとしては126なのですが,派生ジャンルともなると凄い数になりますね.
分布傾向は以下の通りです.
上位80ジャンル以下は共有回数3桁以下となっています.
以下の結果は多く共有された音楽ジャンルTOP10について示しています.
pop : 2611
dance pop : 2367
k-pop : 1934
hip hop : 1034
electropop : 908
rap : 849
pop rap : 697
modern rock : 634
r&b : 603
rock : 513
art pop : 502
特に意味はないですが上位10ジャンルについて円グラフで可視化してみました.
多くの上位ジャンルはpop likeものが多く,ほとんどがpopとrockです.
特にk-popはpopやrapなどの大きいジャンルに比べると狭い範囲のジャンルであるはずなのですが1600ジャンルでの3位というのは相当k-pop人気があることがわかります.
聞かれている音楽ランキング
次に多く共有された曲について上位10件ほど紹介します.
artist_name , track_name , count
TOMORROW X TOGETHER , Ito , 4353
Harry Styles , Adore You , 1944
RBD , Rebelde , 1097
Luísa Sonza , fugitivos :) , 1038
Kim Loaiza , Mejor Sola , 285
Jong Ho(ATEEZ) , One late night in 1994 , 244
Mariah Carey , All I Want for Christmas Is You , 234
NO ONE ELSE , ต่อจากนี้เพลงรักทุกเพลงจะเป็นของเธอเท่านั้น , 214
THE BOYZ , MAVERICK , 186
Adele , Easy On Me , 165
やはり最も共有された曲はk-popであり,上位10件中2件はk-popでした.
収集期間では上位4曲が圧倒的に共有されており,これらの曲はSpotifyにとどまらず他のプラットフォームでも人気であった可能性があります.
楽曲の特徴分布
APIを叩くことで得られる楽曲特徴は多岐にわたります.
その中でも今回は"acousticness","danceability","energy","instrumentalness","liveness","loudness","speechiness","tempo","valence"の分布を見ていきます.これらの特徴は次の特徴空間の可視化でも使用します.
特にdanceability,energyあたりは興味深い結果になったと思います.
acousticness
これは0~1で得られる値で,アコースティック感があるかがわかります.電気を使用していない楽器を使ってて自然な音が前面に出ていれば高いスコアになるという印象でいいんでしょうか.
SNS上で流通しているものの多くはアコースティック感の小さい曲が多いようです.
danceability
0~1で得られる値でテンポやリズムの安定性など複数の要素を考慮して踊りやすい曲かを判断しているようです.
平均が0.603で中央値が0.615と踊りやすさという観点で見ると踊りやすい曲が共有される傾向にあるようです.
energy
0~1で得られる値で名の通りエネルギッシュな曲に高スコアを付与します.例としてデスメタルはスコアが高く,バッハのプレリュードがスコアが低いと紹介されています.
平均が0.619で中央値が0.638とdanceabilityと同様にエネルギッシュな曲が多い傾向にあるようです.
instrumentalness
0~1で得られる値でトラックにボーカルが含まれていないかを予測している値です.0.5以上はinstrumental tracksとして表されているようです.
共有される曲はほとんどボーカル有りですね.
liveness
レコーディングの際のオーディエンスの存在を検出する値です.0.8以上だとそのトラックがライブである可能性が高いようです.
loudness
音量感をdBで示すものです.およそ-60~0dBの値を持ちます.
平均-7.17で中央値が-6.578dBであり,共有される曲自体としては右によっています.聞く側からすると以下の記事のように調整されているみたいですね.
speechiness
話しことばがあるかを検出する値です.トークショーやオーディオブックといったものに近いほど1になります.0.66以上だと話し言葉だけで構成されている可能性が高く,0.33以下だと音楽など非音声的なトラックである可能性が高いようです.
オーディオブックなどの量的面からもそうですし音楽の共有をしたいというユーザの行動からも直感に合う結果になっています.
tempo
推定テンポをBPMで表します.
valence
0~1で得られる値で音楽的なポジティブさを表しています.値が大きいほどポジティブに聞こえます.
平均値は0.472で中央値は0.459と意外と値が小さいことがわかります.
danceabilityやenergyの分布傾向を考えるとvalenceも大きい値を取る傾向にあると思っただけに予想外の結果になりました.
相関関係
収集した曲のみから得られた音楽の各種特徴間の相関関係をヒートマップで描画してみました.
暖色に近いほど相関関係が強く,寒色に近いほど相関関係が小さい結果となります.
例えば縦軸にあるloudnessを見て,横軸のenergyの列を重ねると暖色にマスが塗られていて,その2つは相関関係が強いことがわかります.
上記2つの特徴はアコースティック感とはかなり相関関係が低いことなども読み取れます.
楽曲の特徴空間の可視化
先程までのような分布傾向にある曲の特徴を用い,それぞれの曲の特徴ベクトルと見なして特徴空間に可視化します.標準化を行ったのちにUMAPを使用して二次元に圧縮,可視化をしました.
大きなコミュニティとして2つが存在することがわかります.
plotlyで可視化しており,上記のhtmlをダウンロードすることでその点がどの曲なのかを確認することができます.
共有数で曲のサイズ,色を変更するとこんな感じです.
明るくなるほど共有数が多い曲になります.
例えば最も明るい真ん中のk-popの曲の周辺を見てみるとk-popの曲がいくつか見つかることと思います.pop likeな曲が最大コミュニティに存在しているようにも見えます.
左のコミュニティはオーディオブック系列というわけではないのですが,少数のコミュニティとして成り立っています.共有数もそこまで多いわけではありません.いくつか日本のアーティストによる曲が見て取れます.
音楽を嗜んでこなかったことが悔やまれます.この部分の分析については是非わかったことがあれば教えていただきたいです.
みなさんも是非遊んでみてください.
マウスを曲に合わせると「アーティスト名 : トラック名」で表示されます.
終わりに
今回はSNS上で音楽共有を行うユーザの特性について知るために必要なそもそもTwitter上で流通する曲の特徴について様々な形式で簡単に見てきました.
SNS上のユーザが流通させるトラックは「曲」がほとんどであり,エネルギッシュであったり踊れるような曲である傾向にあるものの音楽的なポジティブさが必ずしもあるというわけではないようです.
トラックにボーカルが含まれていないトラックやオーディオブックなどはほとんど共有されない傾向にあります.
ジャンルとしてはpopな曲がメインで流通しているのですが,特にk-popは多く流通しています.
エネルギッシュな曲調など元気になるような曲が流通しているのはパンデミック下であることが原因なのかもしれませんし,元々共有するとなった際に自分の趣味領域でありながらシェアしやすいジャンルというものに影響されているのかもしれません.
音楽が好きなユーザであっても共有行動には障壁があると考えられますし,ここらへんは今後,ユーザ分析の方で明らかにしたいですね.
今回は撮って出しのようなものなので考察事項が増えたら順次更新します.
他に面白かった関連記事
今回の制限
APIの制限とそのツイート量によって収集できている期間がかなり限られている点に注意してください.
SpotifyのAPIは今回の分析をしようとすると1トラックあたり3回叩かなくてはならず大変です.
地域を絞ればもう少し偏りのある結果になったかもしれません.日本に限定してもk-pop人気なことには変わりなさそうですが.
サーベイしてないですけど,パンデミック前後での音楽共有現象の違いって絶対論文ありますよね.n番煎じ感ありますがスキルもついたし知りたいことを知れたのでOKということにします.
よろしければサポートよろしくおねがいします! 頂いたお金は自分の分析やコンテンツ作成の際に必要な資金として使わせていただきます!