見出し画像

マーケターのための(ほぼ)数式なしで理解するMMM(マーケティングミックスモデリング)入門

こんにちは、DAIです。

本職では、データ分析組織のリードとして、主にマーケティング関連の分析やデータ基盤整備などを主導しています。

本稿では、マーケティング界隈で注目を集めているMMM(Marketing Mix Modeling, 以下MMM)について、その概念や仕組みをデータサイエンスや統計のバックグラウンドのないマーケティング職の方にもなるべくわかりやすく説明していきたいと思います。

社内でMMMが話題になっていたり、プロジェクトが立ちあがろうとしているが、正直よくわかっていない、といった方の助けになれば幸いです。

本稿の想定読者層:

  • マーケター

  • データサイエンティストやデータアナリスト職ではあるが、マーケティング系の分析経験がない方

本稿で得られるもの:

  • MMMが何をするためのものか、その仕組みや基礎概念を理解できる

  • より詳細な解説資料等を読む際に必要な基礎的なMMMの理解

なるべく数式なしで説明していきたいと思います。

MMM(Marketing Mix Modeling)とは何か?

MMMとはマーケティング施策があるKPI(売上や注文数など)に与える影響を分析する手法です。

MMMのご利益には次のようなものがあります。

  • マーケティング施策などの各種要因が売上や注文数などに及ぼす影響を定量化できる

  • マーケティング施策の投資配分の最適化ができる

    • 例:TVCMの効果はすでに飽和しているので、 Web広告により多く投資した方が良い、といったことが定量的にわかる

  • 過去の実績に基づき、何にどのくらい投資するとどのくらいのリターンが帰ってくるかをシミュレーションできる

さて、ここまではよくあるMMMの説明になります。

が、これだけだと一体どのようにしてこれらのご利益を実現するのか?がピンと来ません。

本稿では、より手触り勘を持ってMMMを理解できるように、より詳しく解説していきたいと思います。

MMMを理解する

MMMは広告などのマーケティング施策があるKPI(売上や注文数など)に与える影響を分析する手法、と書きました。

言い換えれば、これは広告などのマーケティング施策があるKPIに与える影響をモデル化することである、とも言えます。
図にすると次のようなイメージです。

マーケティング施策がKPI(ここでは売上)に与える影響をモデル化する

さて、モデル化とは一体なんでしょうか?

ざっくり言えば、なんらかの事象を数式で表現できるようにすること、と言えます。

では、いったいどうやってそれを実現するのでしょうか?

ここで統計や経済学の考え方を応用していくことになります。

MMMの最も単純なモデル化の方法は回帰分析を用いることです。

まずは、回帰分析についてイメージを理解し、そのうえでMMMがどのように作られているか?を理解していきましょう。

回帰分析とは

MMMの話に入る前に、回帰分析について簡単に解説しておきます。

回帰分析とは、ある変数を用いて他の変数を説明・予測するモデルを作る手法です。

例えば、あるアイスクリーム店の売上をその日の気温を使って説明するモデルを作る、などです。

気温と売上の関係のモデル化のイメージ

それは次のようになります。

(あるアイスクリーム店の売上) = (ある係数) × (気温) + (なんらかの定数)

簡単な数式で表すのであれば、

Y = aX + b

のような形式です。

先ほどの図で言うと、「何らかのメカニズム」の部分をこのような数式で表現しよう、ということです。

ここで、

  • 「あるアイスクリーム店の売上」を目的変数

  • 「気温」を説明変数

と呼びます。

※従属変数、独立変数、と呼ぶ場合もありますが目的変数・説明変数の方が直感的でわかりやすいので、本記事では上記の呼び方とします。


先ほどの数式のイメージ

さて、ここに売上と気温を記録したデータがあります。

気温と売上のデータ

このデータを可視化すると次のようなイメージになります。

気温と売上の関係を示した散布図


この関係性を先ほどのような単純な式で表すとどのようになるでしょうか?

先ほどの式は、Y = b + aX のような単純な式なので、直線的な関係しか表現できません。

よって、すべての観測点(売上と気温のセット)を通る線を引くことは難しいので、うまく全体の観測点を表現できるような直線を引くことを試みることになります。

すると次のようになるでしょう。

※このような線形回帰モデルを作る統計的な手法については、この記事では割愛します。

このような線を引くことができれば、気温が38度と予想されている日の売上はX万円になりそうだ、という予測ができそうですね。

回帰分析をMMMに応用する

先ほどは気温でアイスクリーム点の売上を説明するモデルを作りました。

MMMの最も単純なアイデアは、気温ではなく広告費用などのマーケティング施策関連の変数で売上を説明することです。

次のようなデータがあるとしましょう。

広告費と売上のデータ

このデータを使って、先ほどと同じ回帰分析をすると、次のような関係性を導けそうです。

ちなみに、先ほどのようなデータを用いると、

Y = b + aX

b は約71

a は3

となります。

つまり、広告費を1万円増やすと、3万円売上が増加する、というように解釈できます。
また、定数が71なので、広告を打たなくても71万円は売れる、と解釈できます。

ここまでは一つの説明変数だけで売上を説明しようとしてきました。

Marketing Mix Modelingという名前からもわかるように、MMMのメリットは複数の広告施策の効果を横断的に分析できることにあります。

そこで、複数の説明変数で売上を説明することを試みてみましょう。

数式で表すと次のようになります。

(あるアイスクリーム店の売上)

= (ある定数) + (係数1) x (TVCM広告費用) + (係数2) x (Web広告費)

説明変数が二つ以上になってくると、図で表すのが難しくなってくるので、グラフの図解は割愛しますが、概念図としては次のようになります。

例えば、先ほどのような式をもとに回帰分析をするために、次のようなデータセットがあるとしましょう。

各広告投下コストと売上のデータ

このようなデータをもとに先ほどのような回帰分析をすることができれば、各広告が売上に与える影響を定量化できそうです。

このように複数の説明変数がある回帰分析を重回帰分析と言います。

かなり原始的な分析ではありますが、MMMがどのような分析手法なのか、なんとなく見えてくるのではないでしょうか。

MMMにおいて重要なその他の要素の導入

ここまでの説明にはいくつかの落とし穴があります。

別な言い方をすれば、現実の広告の効果を表現するにはシンプルな回帰分析(重回帰分析)はあまりに事象を単純化しすぎている、ということです。

ここでいくつかの重要な要素を見ていきましょう。

時系列データとしての取り扱い

まず、MMMで扱うデータは基本的に時系列データです。

時系列に並んだデータのある日のデータは過去のデータの影響を受けている可能性があります。

例えば、このアイスクリーム店がある町は、町として発展していて、新しく人が入ってきたり、他の地域からも来訪があるなど、町自体の集客力が高まっているトレンドにある地域かもしれません。

とすると、日付が経過するほど、そもそもとしての売上が右肩上がりに伸びやすいトレンドがあるかもしれません。

その場合、このような右肩上がりのトレンドを広告の効果としてしまうと、広告の効果を過大評価することになりかねません。

このように時系列データには考慮すべき特徴がいろいろあるため、実際に実務で用いられるMMMの多くは時系列分析の手法を取り入れています。

キャリーオーバー効果(アドストック効果)

先ほどの時系列データである、という話と一部重複しますが、広告の効果にも時系列性を考慮する必要があります。

広告を打ったとき、その広告の効果はその日だけで終わってしまうでしょうか?

例えば、「最近、広告であのお店を見たから今度の週末に行ってみよう」といった経験はないでしょうか?
ここからもわかるように、広告の効果は打ったその瞬間だけでなくその後も続くと考えるのが妥当そうです。

もちろん商材によっては、広告を打った瞬間にその効果がピークを迎え、その後は徐々に減衰していくものもあるでしょう。

また、他の商材では、広告を打ってから少し後に売上の効果がピークになるものもあるかもしれません。

例えば、自動車のような高額かつ検討期間が比較的長い商材は、広告を打ったその日に成約(売上)とはならないことが想像されます。

このような効果は、広告の種類によっても変わってくるでしょう。

やや話が発散しましたが、このように広告を打った後もその影響が残存する効果をキャリーオーバー効果と言います。

キャリーオーバー効果をモデルに組み込むための数学的な工夫については、細かい説明は割愛しますが、例えば、一期前の広告出稿額のα%が残存する、というような計算をするなどがあります。

次の図のようなイメージです。

この図では、4/4の広告投下コストに対して、前日以前の3日間に投下した広告効果が残存するという仮定で計算をしています。

この残存効果を表現するために、過去の投下コストの一定割合を当日のコストに加算しています。

よって、4/4の実質的なコストは、4/1〜4/3の投下コストの残存分を加えたもの、となります。

これ以外にも遅れてくる効果をモデルに取り込む方法はいくつかあり、商材によって妥当な方法を取捨選択していくことになります。

ちなみにここまでキャリーオーバー効果と呼んできましたが、アドストック効果と呼称される場合もあります。
広告の効果がストック(蓄積)される、ということですね。

補足「残存効果をどう定量化するか??」:

この説明で、過去の広告の効果の残存をどの程度見込むか(この例で言えば、α%残存する、というαの値をどう決めるか)、をどうやって決めるのか?と疑問に思ったかもしれません。

ケースバイケースですが、残存割合自体を統計的手法で推定するということが実際には多いかと思います。

「ある広告の効果は残存する」という前提に立った時、どの程度残存すると考えるのが妥当なのか?、を得られたデータから推測する、ということです。(つまり、αの値をデータから推定する。)

飽和効果

もう一つ重要な概念が飽和効果です。

説明に入る前に、少し前のアイスクリーム店の売上と広告費の関係を回帰分析したときの図を思い出してみましょう。

このモデルによれば、広告費は増やせば増やすほど売上がアップするようです。

しかし、本当でしょうか?

たしかにある程度までは広告費を増やせば売上に対してプラスの影響はありそう思えますし、実際のデータもそのようになっているようです。

では、このアイスクリーム店の店長が広告費を10倍にしたら売上もそれに比例して伸びるでしょうか?

おそらくそんなことはないでしょう。

アイスクリーム店は、商圏がそのエリアに限られていますから、どこかで限界が来るのは想像に難くありません。

アイスクリーム店に限らず、広告の効果は一般的に飽和するものであると考えられています。

このように広告費を増やしてもその効果が徐々に小さくなっていくことを飽和効果と言います。

実際のMMMではこの効果を表現するために、先ほどの単純な線形回帰式に様々な工夫を加えます。

数式に苦手意識がある方は読み飛ばして構いませんが、例えば以下のような関数を用いること飽和効果を表現することができます。
※数式に苦手意識がある人は、以下のグラフの図のイメージだけ参照してください。

xが大きくなるほどYの伸びが鈍化するような関数の一例

ここでaを1としたときの上記関数のグラフは以下のようになります。
https://www.geogebra.org/ を使って作成

y = 1 - e^(-x) のグラフ

この関数の細かい内容は一旦無視してください。
ここで理解して欲しいのは、横Xの値が大きくなるほど縦軸Yの増加が緩やかになる、という性質です。

これは飽和効果をモデルに取り込む方法の一例であり、実際には様々な方法があります。

いずれにしても、理解したい点は、広告の飽和効果のような妥当な仮定をうまくモデルに取り込む工夫をMMMにおいてはすることが多い、ということです。

広告投資の最適化シミュレーション

ここまでMMMの構成要素を見てきましたが、MMMというと一般的には、投資のアロケーションの最適化までを含むことが多いように思います。

ここではどのようにして投資の最適化を行うのか?のイメージを示します。
実際のMMMにおける投資アロケーションの最適化は、もっと複雑な方法で行います。あくまでイメージを掴むために単純化して解説します。

さて、ここまでの要素を使ってうまくモデリングができたとすると、飽和する広告効果(飽和効果)、蓄積する効果(アドストック or キャリーオーバー効果)、なども含めてマーケティング投資効果を数式化できているはずです。

ここで、仮に3つの広告チャネルがあるとします。AとBとCです。
そして、分析の結果、それぞれの投資に対するリターンは次のグラフのような関係性となっていることがわかりました。

各広告チャネルの投下コストに対するリターンのグラフ

さて、現時点では、それぞれのチャネルに100万円、300万円、400万円のリソースを投下済みです。

投下済みの実績をプロットした

この状況で、追加でマーケティングに使える予算がさらに100万円増えました。どのチャネルに投資すべきでしょうか?
(ここでは話を単純にするために1チャネルにしか投資できない、とします)

投資済みのところから追加的な100万円の効果を可視化してみると次のようになります。

投下済みのところからさらに投下した場合どうなるか?

Cはいったん除外してAとBを比べてみるとAの方が明らかに100万円に対して帰ってくるリターンの増分が大きそうですね。
とすると、リターンを最大化する観点からはAに投資するのが良さそうです。

実際にはもっと複雑な計算をしますが、各マーケティング施策の投資とリターンの関係性が定量化できているのであれば、このように投資のアロケーションを(理屈上は)最適化できることがなんとなくイメージがつくのではないでしょうか。

ちなみにMMMを実施するオープンソースソフトウェア(OSS)として公開されているものでは次のような最適化と可視化の機能を備えています。

例えば、Meta社が出しているMMMのライブラリでは、次のような予算アロケーションの可視化が可能です。

予算アロケーションを変えることで、得られるリターンがどう変化するか?をシミュレーションして可視化しています。

例えば、真ん中の列(青いグラフ群)は、同じ投下コストでもモデルが示すアロケーション通りに実施することで一番左よりもROIが良くなることが示唆されています。

source : https://facebookexperimental.github.io/Robyn/docs/features ※赤色注釈は筆者による

MMMってなんだか仮定だらけではないか?

ここまでの説明でMMMが様々な仮定のもとに分析されている、というイメージを持ったかもしれません。それは実際にあたっています。

極端な話、売上を気温で説明しようが、(複数の)広告による効果として説明しようが、それは分析者の自由です。

しかし、”このようなメカニズムで説明することが妥当である”というという状態を達成できるよう、この分野では様々なノウハウが提案・公開されています。

MMMは、そのような知見を活用しつつ、分析者が分析対象についての妥当なモデル構造を定義し、その妥当性を分析結果を用いながら評価して、現実の広告の効果(の結果が反映されたデータ)を最もうまく表現できるモデルを作る営みです。

“最もうまく表現できる”という言い方は歯切れが悪いように聞こえます。

実際のところ、何が真に正しいモデルなのか?はわかりません。

そもそも、複雑な統計モデリングを駆使したとしても現実世界の事象を余すところなく表現するのは困難です。

「そんな真実なのかどうかもわからないモデルを作ることは無意味ではないか?」と思ったでしょうか?

そんなことはありません。

「妥当そうなモデル」を作り、そのモデルを解釈すれば、人の勘と経験に頼るよりもより良い広告投資のアロケーションを実現できる余地はあります。

例えば、バンダイナムコネクサス社が公開しているMMMの事例では、次のような効果が見られたとされています。

広告ごとにコストとインストール数の関係がわかったので、これを使って広告宣伝予算の最適配分を計算します。

(中略)

過去実績の平均コスト(緑線)でみると、最適化によってインストール数を1.5倍程度引き延ばせることが期待される結果となりました。

その後実際にフィージビリティスタディを行い、インストール数の増加を確認できました。

https://www.wantedly.com/companies/bandainamco-nexus/post_articles/900584

補足:どうやってモデルの妥当性を評価するのか?

このようなビジネス実務で用いるためのモデルの評価は基本的にオフライン評価とオンライン評価の二段階を踏みます。

オフライン評価とは、過去データ等を用いた机上の評価です。例えば、過去データを使ってモデルの精度を評価します。

オンライン評価は、要は実地検証です。実際に構築したモデルを用いて実際のビジネスアクションを変化させたりすることで、狙った通りの結果が出るか?を検証します。

オフライン評価

大きく2つの方法があります。

一つは、作ったモデルが実績をどの程度うまく予測できているか?を統計的に評価することです。

この時、モデルを作成する時には使わなかったモデルにとっては未知のデータを与えたとしても、予測と実績がある程度一致するか?、も合わせて見ます。

これにより、広告が売上(やその他のKPI)に及ぼす影響をどの程度うまくモデリングできているか?を評価することができます。

(モデリングがうまく行っているなら、予測と実績はかなり近くなるはずです)

もう一つは、定性的評価です。

MMMでは広告の効果を様々な方法で定量化することができます。

その結果を使ってマーケティング担当者の感覚とマッチするか?を評価する、という方法です。

オンライン評価

実際にMMMから示唆された広告アロケーション通りの広告投資を行い、従来よりも成果が上がったか?などを検証します。

ここで注意したいのが、広告の効果検証の場合、Web広告のようにABテストをできないケースがあることです。

例えば、TVCMをまったく同じエリアで同じ日に流した場合と流さなかった場合ではどのくらい売上に違いが出るか、という実験はできません。
流す日と流さない日に分ければいいではないか?と思うかもしれませんが、それだと広告を流したか流していないか、以外の要因が揃わなくなってしまいます。(日付が異なるからです。)

文章だとわかりにくいので図解してみましょう。
例えば、あるアイスクリーム店がTVCMの効果を知るために、CMを流した日と流さなかった日を作ってみた、とします。

この例にあるように、日付が変われば、CM以外の要因が変動する可能性があります。例えば、CMを流さなくても売上が減らなかった、という事実を目にしたとしましょう。しかし、実は近隣でイベントがあったため、集客が捗ったことが売上が減らなかった要因かもしれません。

このように、広告の効果測定には困難が伴うケースがあります。

このような状況でも広告のアロケーション変更の効果を適切に評価するためには、統計や計量経済学などの手法を応用するなどが必要になってきます。
ここでは詳細は活用しますが、このような効果検証についてはデータ分析者と協働して適切に設計・実行する必要がある、という点だけ覚えていただければと思います。

MMMを経営に活かすには

MMMを用いることで、経営においてはどのようなメリットがあるでしょうか?

経営的なメリットはやはり広告・マーケティングキャンペーン等のコストのアロケーションの最適化です。

例えば、MMMを用いることで次のような示唆が得られます:

  • これ以上TVCMに投資するよりも、Web広告に投資した方が良い

  • あるシーズンにおいては、TVCM、別なシーズンはWeb広告に投資、 というようによりメリハリの効いたを投資をした方が良い

そして、これらの広告費アロケーションを最適化する意義は売上などの重要KPIを向上させることができるということにあります。

もっと言えば、同じ広告コストでより大きな成果を上げることができる、ということです。

これはやらない手はない!

と思うでしょうか?

しかし、MMMを実成果につなげるためにはいくつかのハードルがあります。

MMMを経営に活かすうえでの課題1:意思決定ができない

仮に良いMMMのモデルができたとしましょう。しかし、これだけでは実成果は生まれません。

このモデルが示唆する広告の最適アロケーション案に沿って実際に広告費のアロケーションを変更して初めて成果が出ます。(MMMの出した示唆が正しければ、ですが)

しかし、最終的にその意思決定をするのは「人」です。

広告費のアロケーションに対して責任を持つCMOやマーケティング責任者をあらかじめ巻き込みながら納得感のあるモデルを作ることができていれば、モデルからの示唆をすんなりと受け入れてくれるかもしれません。

しかし、意思決定者がMMMをあまり理解していない状態で、最終的なアウトプットだけ見せても、納得感がないということで実際のアクションにまでつながりません。

CMOやマーケティング責任者がMMMの技術的な内容を理解していることは稀なので、MMMを用いて広告投資のアロケーションの最適化をするのであれば最終的な意思決定者とのコミュニケーションプランはしっかり設計しておくべきでしょう。

また、アロケーションを最適化する広告予算自体が大きい場合、想定通りの結果にならなかった場合、経営・事業に与える影響が大きくなります。
大企業であれば、数億、数十億、数百億、という広告予算を扱うことも珍しくありません。
このような大きな予算のアロケーションを変更することは、当然、売上や利益の目標達成にも大きな影響を及ぼします。
このような状況では、MMMのモデルの示唆通りにアロケーションを変えることに二の足を踏んでしまうかもしれません。

この問題に対する対処法としては、やはり大きく広告アロケーションを変える前に、小さく実験する、というフェーズを挟むことが挙げられます。
MMMを経営に活かすためには、このようなスモール実験のフェーズも含めてプロジェクトを設計するということも必要になってきます。

MMMを経営に活かすうえでの課題2:モデリングが難しい

MMMは、分析者が分析対象のビジネス構造を理解しながらモデリングをしていく必要があります。

また、手に入るデータには多くのバイアスがかかっている可能性があり、そのバイアスを取り除きながら妥当なモデルを作るためにはそれなりのスキルが必要です。

うまくバイアスを取り除かないと、単なる季節的なトレンドを広告の効果と誤解してしまう、など意思決定上の問題を起こす可能性があります。

例えば、大型商業施設であれば、ゴールデンウィークなどの大型連休時に売上が増えるのは当たり前でしょう。

この時期にたまたま広告を打っていたとして、それは本当に広告の効果でしょうか?

この場合、広告の効果を過大に見積もってしまう可能性があります。

過大に見積もった広告効果をもとに意思決定を行なった場合、思ったような成果があげられない可能性があります。

MMMで扱うデータは様々なバイアスを含んでいることが多いため、それに注意しながらモデリングをする必要があります。

このためには、事業ドメインの知見やバイアスに対処するためのモデリングスキルなどが求められます。
先ほどのコミュニケーションが重要ということにも通じますが、事業ドメイン知識がなくてもそれを分析者がカウンターパートとなるビジネスサイドのメンバーから引き出す力が求められます。

MMMは、AIにデータを投入したらいい感じにアウトプットをしてくれる、というものではないためデータさえ用意すればいい、という類の取り組みではないのです。

よって、ビジネスサイドと分析者がモデリングの課程でしっかりとコミュニケーションのラリーをすることが重要です。

これは分析者だけでなく、ビジネスサイドのメンバーにも求められるスタンスです。

例えば、モデリングの途中段階で、マーケターから見て「これは私の感覚と違う」ような結果が出たとしましょう。
このとき、非分析者のメンバーも短絡的に「これは私の感覚と違う → だから、MMMなんてやっぱり使い物にならないんだ」と考えてはいけないのです。
「なぜ感覚と異なるのだろう?」と考え分析者と一緒に「どうやったらより現実に即したモデリングができそうなのか?」を考えるということが必要です。

まとめると・・・

  • MMMは様々なバイアスのかかった広告データを扱う

  • 意思決定に足る妥当なモデリングを行うためには分析者とマーケターなどの非分析者の密なコミュニケーションが必要である

    • これを舵取りするスキル・経験値のあるPM相当の人が必要

  • これらの要因から比較的難易度が高い分析である

と言えると思います。

とはいっても今後多くの企業がMMMに向き合う必要性は増えると思われる

MMMの難しさについて、ややネガティブなトーンで書いてしまいましたが、今後多くの企業がMMMに向き合う必要性は増えると思われます。

今後クッキー規制が強化される中で、Web広告の効果測定自体が従来よりも難しくなる可能性は高いと言えるでしょう。

とすると、その対策としてMMMのようなアプローチに頼るシーンが増えてくると思われます。

ここまでの説明で特に詳しく書いてきませんでしたが、MMMに用いるデータにおいては、例えば広告の各クリックと注文データを紐づける、といったことが必要ありません。

なぜなら、基本的にはMMMは、ある期間にどのくらい投資をしてどのくらい売上(あるいは他のKPI)があったか、というデータから投資とリターンの関係性を分析する手法だからです。

このような特徴からクッキー規制により広告のクリックと注文やアクセスが紐づけできなくなっても広告の効果をMMMで分析できるようになることが期待できるのです。

Excelで理解するMMM

すいません!準備中です!
どこかで別途、記事にしようと思います。

まとめ

  • MMMとは、複数種類の広告などのマーケティング施策が、売上等の重要なKPIに与える影響を定量的に詳らかにする分析手法

    • 様々な施策を横断した分析ができるので、 施策横断でマーケティング投資予算のアロケーションの最適化ができる

    • マーケティング投資予算のアロケーションの最適化ができれば、 同じ予算でもより大きな成果を得られる。

  • MMMを活用するには、MMMから出た示唆をもとにマーケティング責任者が意思決定をする必要がある

    • 意思決定者が納得して意思決定をしてもらえるように、MMMのモデリングプロセスへの巻き込みやコミュニケーションプランもしっかり設計する必要がある


企業様におけるデータ活用のアドバイザリーなどもさせていただいております。
お仕事のご相談・お問い合わせなどはこちらまで


いいなと思ったら応援しよう!