見出し画像

【データで語るMrs.GREEN APPLE】Spotify APIを使って楽曲特徴量を因子分析してみる

この記事は、偏愛とマーケティング研究所のマガジン「偏愛研究レポート」に収録されています。毎週月曜に偏愛とマーケティング研究所メンバーの頭の中が更新されていくので、ぜひご覧ください。

最初の方にSpotifyの日本トップ50の楽曲を数値だけで解釈してみるという記事を書きました。今回はその中でもMrs.GREEN APPLEだけに絞って特徴量を分析してみる記事です。

また、今回の分析をする際のコードに関しましては、以下の記事を参考にさせていただきました。

前回もSpotify APIを使って色々とみて見たのですが、このSpotifyAPIがとにかくすごいんです。Spotifyは独自の指標を用いて楽曲を数値化しているのですが、その数値化したデータをSpotifyAPIを使用することで見ることができます。

今回は、そんなSpotify APIを用いてMrs.GREEN APPLE(以下、「ミセス」)の楽曲の特徴量を見ていきます。

そもそも因子分析とは

そもそも因子分析と言われても困る方も一定数いらっしゃると思うので、因子分析の直感的な理解ができることも1つの目標として記事を書いていきます。

Spotifyでは以下のような楽曲の数値情報をAPIにて公開しています。

Spotifyが公開している楽曲の数値情報

  1. acousticness(アコースティック感)

  2. dancebility(踊りやすさ)

  3. length(曲の長さ)

  4. energy(エネルギッシュさ)

  5. instrumentalness(インスト感/歌声が入っていない)

  6. liveness(ライブ感/聴衆がいるか)

  7. loudness(音量・音圧)

  8. mode(マイナーコード:0/メジャーコード:1)

  9. speechiness(言葉がどれくらい入っているのか)

  10. tempo(テンポ)

  11. key(キー)

  12. time_signature(拍子)

  13. valance(悲しい感じなのか陽気な感じなのか)

  14. popularity(相対的人気度)

これらの指標に基づいて一気にグラフに落とし込むことができれば、視覚的に分かりやすくなります。
ただ、私たちが想像できるグラフってせいぜい3次元のグラフ(x軸、y軸、z軸)になります。中には2次元のグラフ(x軸とy軸だけのやつ)だけでもお腹いっぱいの方もいらっしゃるかもしれません。
(4次元とか5次元空間を頭の中でイメージできるのかを想像してもらえれば何となく難しいことは理解してもらえると思います)

ただ、実際は"ミセスらしさ"を表現するためには14も指標は必要ないのでは?(指標をまとめた因子があるのでは?)と解釈します。

そこで、使うのが因子分析です。
因子分析は、観測された多数の変数(14個の指標など)を、それらの変数間の共通因子に基づいてより少ない潜在的な因子にまとめる手法です。
因子分析の目的は、元の変数の変動の大部分を説明できるような相関構造を持つ少数の因子を特定することです。

指標1と指標2の内容は例です

こうすることで、私たちが普段からよく見る2次元のグラフ(x軸とy軸のやつ)に落とし込むことができます。

因子分析で分かったミセスの特徴

ここまで書いてきたような流れで、Spotifyに掲載されているミセスの楽曲を因子分析をすると上記のようになりました。

ここで今回の分析での縦軸と横軸について説明しておきます。

#          item   ML2   ML1    h2    u2 com

# energy              2  0.90  0.21 0.800 0.200 1.1
# loudness            3  0.67 -0.51 0.803 0.197 1.9
# acousticness        5 -0.66  0.06 0.454 0.546 1.0

# valence             7  0.50 -0.13 0.284 0.716 1.1

# danceability        1 -0.24 -0.23 0.098 0.902 2.0

# speechiness         4  0.11  1.01 0.995 0.005 1.0
# instrumentalness    6 -0.14  0.40 0.200 0.800 1.2

縦軸(ML2)では、
energy(エネルギッシュさ)
loudness(音量・音圧)
acousticness(アコースティック感)
が大きく影響しているようです。

一方、横軸(ML1)では、
speechiness(言葉がどれくらい入っているのか)
が大きく影響しているようです。

つまりこれらをまとめると、

x軸(ML1)の値が大きければ大きいほど
→言葉多い

y軸(ML2)の値が大きければ大きいほど
→エネルギッシュさが高くなり、音量音圧が大きくなり、アコースティック感がなくなる

と解釈するのが良さそうです。

特に、赤枠で囲んだ部分には2020年にリマスター版が出されている曲が集中しているのですが、このリマスター版は2020年までのミセスを代表する曲が多いようなので、2020年までのミセスの曲の特徴が赤枠部分だと把握して良さそうです。(つまり2020年までの楽曲の特徴としては、とにかく言葉が多くどちらかというとエネルギッシュな曲が多い)

さらに全体を通してもML1が低いかつML2が高い楽曲(言葉が少ないかつエネルギッシュな楽曲)がほとんどないのもミセスの楽曲の特徴のようです。

偏愛とマーケティング研究所について

偏愛とマーケティング研究所では、データの集め方、現場で活用できるデータ分析の方法を紹介しています。 「データを活用したいけど、何をしていいのか分からない」 なんて方はお気軽にご連絡ください。

著者: 納富 崇 / NOTOMI Takashi (X: @takashi_notomi)
偏愛とマーケティング研究所 代表 / データアナリスト

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?