10分Excelデータ分析~相関分析をやってみよう~
データとデータの関連性を見抜くことができれば、効果的な意思決定の助けになります。いわゆる
「相関分析」
と呼ばれる分析で、日常生活においてもよく使われてたりします。
わかりやすい例をあげると、賃貸物件の金額があります。
・駅からの距離が近くなればなるほど、金額が上がる
・築年数が古くなればなるほど、金額が下がる
このあたりはすでに知識として広く知られているところですね。
「あるデータの値が上がる(または下がる)ことで、別のデータの値が上がる(または下がる)傾向を見出す」
のが相関分析です。
基本的な統計分析手法ですが、分析から次の打ち手に繋げやすいので、とても使い勝手が良いです。
この相関分析をExcelで手軽に行う方法があります。
はっきり言って
本当に簡単
です。
統計の知識がなくても数字に弱くても、なんならエクセルの操作自体がいまいちな人でも、速攻でやれてしまう方法です。
STEP1 相関を出したいデータを選ぶ
まずはデータを準備します。
今回デモデータとして活用するのは、ポケモン(第7世代までの800種)のステータスデータです。この相関を確認してみますが、分析対象とする項目は主要なものに絞ります。
HP
こうげき
ぼうぎょ
すばやさ
とくこう
とくぼう
たかさ
おもさ
この8種類にしましょうかね。
中身はこんな感じになります。
STEP2 分析ツール『相関』を使用する
では分析に入っていきます。
メニューの「データ」から、「データ分析」を選択します。
*「データ分析」ツールは無料で実装できるエクセルプラグインになります。やり方はこちら。
「相関」を選択します。
分析したいデータ範囲を選択し、「OK」をクリックします。
これで終了です。
STEP3 結果を見る
分析結果は新規ワークシートに出力されます(どこに出力するか選択可能です)。
わかりやすいように条件付き書式で色分けしていますが、数値が1に近いほど(色が濃い)ほど相関関係が高くなっています。
例えばこのセルは「こうげき」と「ぼうぎょ」の相関を示しており、その値は0.46になります。一般的にこの数値が0.7を越えれば高い相関関係にある(片方の数値が上がれば、もう片方の数値も上がる)とされているので、こうげきとぼうぎょの関係は、そこまで相関が高くないと言えそうです。
こうして見ると、どのパラメータも相関が高いものは無く、「たかさ」と「おもさ」の相関値0.62が最高になります。あとは「とくこう」と「とくぼう」の相関値が0.5程度とまあまあの値でした。
この分析からわかることは、ポケモンの主要ステータス間では高い相関を示す値は無いということであり、逆に言うとパラメータの偏りが生まれにくくバランスが重視された設計になっている、と読み取ることができます。
どんなときに使う?
相関分析は様々なシチュエーションで使用することが可能ですが、わかりやすい使い方で言うと
・広告クリックとCVの相関を確認する
・サイトの滞在時間とCVRの相関を確認する
などがあるかなと思います。
「達成したいKPI」を軸にしたとき、どの値を上げればそのKPIを一番上げやすくなるか、という点を発見するのに役立ちます。
今回は、ほぼワンクリックと言っても差し支えないレベルの操作で相関分析を行う手法をとりあげました。それではまた次回。
この記事が気に入ったらサポートをしてみませんか?