相関分析とレコメンデーション(ユーザーの行動、分析できますか?より)
ショッピングサイトなどでもよく出くわす「あなたへのおすすめ」の仕組みにも使われる相関分析をエクセルで簡単に学んでみる回です!
目次
相関分析とは
レコメンデーションに用いられる相関分析
excelで相関分析してみた
相関分析とは
例えば、気温とアイスの売上データを分析する際に、x軸を気温・y軸をアイスの売上とした場合↓↓
・気温が上がる(x軸が原点からみぎにすすむ)
・アイスの売上が上がる(y軸が原点から上に進む)
ような直線を描く場合に”相関がある”といいます。(マルチコ・多重共線性の概念は今回ないものとします)
KOTODORIさんのサイトにてわかりやすいイメージがあったので引用させていただきます↓↓
レコメンデーションに用いられる相関分析
では、この相関がどのようにレコメンデーションに用いられているのでしょうか?
データの軸は以下です↓↓
・ユーザーが閲覧した製品ページのデータ
・ユーザーが購入した製品のデータ
上記のデータを蓄積し【製品Aのページを閲覧した人は、製品Bを購入する確率が高い(製品Aのページ閲覧と、製品Bの購入に相関がある)】といった考え方をもとにあなたのおすすめを分析しています。
excelで相関分析してみた
では、実際にexcelを用いて相関分析を行っていきます。
今回はこんな仮説を立ててみました!
仮説
アニメAの視聴回数が増加すると、コラボグッズ総購入金額が増加する
集めるデータ
・対象者のアニメ視聴回数
・対象者のコラボグッズ購入層金額
※今回のデータは、乱数発生にて独自に作成した、仮のものです。(仮説の立証はできません)
データの持ち方
列は、no・視聴回数・グッズ購入金額を並べます。(行列が逆にならないように気をつけましょう!)
分析のすすめかた
①データ>データ分析>相関>OKをクリックします
②no.列以外のデータ範囲を選択>データの方向”列”>先頭行をラベルとして使用に✔>出力オプション・新規ワークシートを選択>OKをクリックします
→★新しいワークシートにワクワクの結果が表示されます!
結果の見方
出力されるアウトプットはこのような感じです
この場合赤枠の数字を見ていきます。
今回の結果は0.80でした。相関分析では、この結果が1に近いほど相関が強いということになります。相関係数の目安は下記です。
なので、今回のようなデータが実際に取得できた場合
仮説:アニメAの視聴回数が増加すると、コラボグッズ総購入金額が増加する
は立証されたと言えます!
★アニメの視聴回数が増加すると、コラボグッズ購入金額が増加する★
データさえ取れてしまえば、excelでも簡単に分析ができてしまいます!
分析感覚を掴むためにも実際に関心のあるデータを用いて分析をしてみてはいかがでしょうか?
この記事が気に入ったらサポートをしてみませんか?