見出し画像

マーケティングデータ解析(回帰分析の基礎)

今回は、回帰分析とマーケティングの関係について書きます。

この記事で学べること
・ 単・重回帰分析とは
・ 回帰分析がなぜ Marketing  に重要なのか 

まず単回帰分析とは何か説明をします。
例えば、「目標とする売り上げを達成するために何度プロモーションを打つべきか」を検討するお題があるとします。

この1つの目的変数(売り上げ)を1つの説明変数(プロモーションの回数)で予測するもを単回帰分析と言います。
式で表現すると Y(目的変数)=aX(説明変数)+b のように表します。

例えば、過去の売り上げとプロモーション回数のデータを2次元のグラフにプロットしたとします。この時に、各点とこの一次方程式の距離が最小となるaとbを決める作業を回帰解析と言います。

無題のプレゼンテーション

さて、実際に解析を行う際には python のライブラリを利用して計算したり、エクセルで分析を行うことになるのかと思います。

無題のプレゼンテーション

数値を入れて解析をおそらく上記のような指標に基づいて値を得ることができます。今回はオレンジ色に塗った値に着目をいたします。

□切片の係数
X=0つまりプロモーションが0回の時の売り上げを表します。

□プロモーションの数係数
プロモーションの数を一回増やした時の増加する売り上げ

□決定係数R^2
回帰分析によって求められた目的変数の予測値が、実際の目的変数の値とどのくらい一致しているかを表している指標です。マーケティングの世界では人間の複雑な行動を数式には反映しきれないため、この値は一般的には低い値となります。この例の 0.601はマーケティングの世界ではかなり高い値となります。

□P値
それぞれの説明変数の係数の有意確率を表します。
一般的に、有意確率が5%を下回っているとその説明変数は目的変数に対して「関係性がある」という判断をします。この表の0.00が意味するところは、回帰が変わる可能性がほとんどないことを意味します。つまり、低いあたりであるほど、回帰の計算に自信があることになります。

なんとなくご理解をいただけたでしょうか?
さて、実際の世界では売り上げに影響を及ぼすのはプロモーションの数だけではありません。

実施に回帰の正確性をあげるためには、影響を及ぼしていると思う他の変数も入れる必要があります。
このとき、 Y= a1X1 + a2X2 + a3X3 +...a0 のように複数の説明変数で表現をすることができます。これを重回帰分析と言います。

重回帰分析でよく議論になるのが、どの説明変数入れて、どの説明変数を入れないかです。
問題となるケースをみていきましょう。
売り上げ = a+ b1*支払われる金額 + b2*特徴有 + b3*展示有
※特徴有・展示有については、該当する場合は1、しない場合は0とする。

これであるデータを回帰分析としたとします。
この際に、このお店では価格は売り上げに影響を及ぼさないだろうと仮定して、回帰分析時に価格を入れないで計算する場合(Estimated model)も算出をします。

無題のプレゼンテーション

全く違う値が得られましたね。。。
この場合、どう評価すればいいでしょうか。
決定係数R^2比較すると True Model の方が値が高いため、目的変数が確からしいと言えますね。
でも、なぜ価格を除いたことで展示、特徴、そして、切片の値が小さくなったのでしょうか。これは、直感的には価格が重要な要素で、価格がわからなかった場合は、展示や機能的な特徴が多くないと売れないということを意味していると考えられます。ただ、決定係数R^2が0.188となったことより、うまく予測ができていない、つまり価格は含めるべき要素とのことがわかりますね。

他の例もみてみましょう。
背の高い人が低い人よりお金を稼でいるのか否かを調査します。
今回の目的変数は、稼ぎ($)とし、説明変数を背の高さ(inches)、性別(1=men, 2 = femal)の組み合わせとします。

あるサンプルを元に、稼ぎ = f(背の高さ), 稼ぎ = f(背の高さ、性別=男)の二つのケースを考えます。実際に計算すると下記のような値を得られたとします。

無題のプレゼンテーション

性別が男性の例を加えることで見えてくるのは、背の高さが稼ぎに与える影響が小さくなっているということです。
右側の表を見るとP値が<0.01となり、背の高さのP値が0.02となっています。
これが意味することは、性別が男性が稼ぎに大きな影響を及ぼしているということです。
性別を入れないと背の高さが稼ぎに大きな影響を及ぼすと見えてしまいますが、性別を説明変数に入れることで、実は性別が稼ぎに大きな影響を及ぼしていることがわかります。
これは直感的にも男性が女性より背が高いということより明らかですよね。
さらに詳細を見るために相関行列をみてみましょう。

無題のプレゼンテーション

性別が男性であることと身長の高さには大きな関連性があることがわかります。※当たり前のことで。

ここで、お伝えをしたかったのは説明変数を抜いて計算したり、含めて計算することで、どの説明変数が大きく影響を及ぼすのかを知れるということです。

まとめると、、、

回帰分析とは
・目的変数を複数の説明変数(プロモーションの回数)で予測するも

マーケティングになぜ重要なのか
現実世界であるマーケティング施策を実施した際の予測ができる
・複数の要素から目的を達成するために一番影響を与える要素を知ることができる

この記事が気に入ったらサポートをしてみませんか?