見出し画像

「確率思考の戦略論」の分析で、プレゼント・キャンペーン応募総数を推計してみた。

自己紹介

株式会社秤の小川と申します。セールスプロモーション業界で4年、電通グループなど広告会社の営業とプランナーとして10年、データ分析を軸にしたコンサルティング支援3年強。マーケティング戦略から戦術まで幅広く関わり、2018年11月に「Excelでできるデータドリブン・マーケティング」という書籍を出版しました。

宣伝会議のマーケティング分析講座の講師や企業研修の講師など、マーケティングを科学するノウハウを共有しています。

本noteでは

ツイッターの広告を使って「最後にいつ〇〇したか?」を調査した結果(本noteギージュアルにした内容)から需要を定量化し構造的に把握(または予測)する、 Excelで行える分析法を紹介し、それを習得するための研修も紹介させていただきます。

「確率思考の戦略論」で紹介されたガンマ・ポアソン・リーセンシー・モデル

皆さんは、マーケティングの名著「確率思考の戦略論」をご存知でしょうか?ユニバーサル・スタジオ・ジャパン再建の立役者のマーケターの森岡氏と同じくアナリストの今西氏による書籍です。

同書では、消費者の購買回数の分布に共通する「法則」があり、それを用いることで、市場構造の核となる需要を定量的に予測または把握ができるガンマ・ポアソン・リーセンシー・モデルなどの分析法を数式と共に丁寧に解説しています。

ガンマ・ポアソン・リーセンシー・モデルとは、最後に、いつ買ったか?訪れたか?食べたか?など最終のアクションを行ったタイミングを調査したリーセンシーデータを元に、当該アクションの頻度の確率分布を把握する分析です。分析したモデルを元に需要予測にも使えます。同書で語られていたエピソードに、USJが10周年となる2011年に前年7万人のハロウィーンの集客を倍の14万人以上にできると需要を予測し、そこに注力する戦略を導き成功した事例があります。その意思決定に使われた分析法です。

最近、日本のプレゼント・キャンペーンの応募総数はどれくらいか?把握したいというお題があり、全企業が実施しているキャンペーン応募数を把握できるデータベースは私の知る限り存在しないため、ガンマ・ポアソン・リーセンシー・モデルによって推定することにしました。

プロモツイートで全国調査

2020年4月28日の朝から1日で日本全国のツイッターユーザーを対象とした広告配信を行い、「あなたは最後にいつ、プレゼント・キャンペーンに応募しましたか?」を聞きました。

およそ10,000円の広告配信で6,000弱の回答が得られました。エンゲージメント単価3円入札からはじめ、配信ペースに合わせて単価を下げ、ほとんどの配信期間を1円入札で運用できました。予想を上回るパフォーマンスでした。この調査法自体が、結構「使える」かもしれません。

※十分な標本サイズが得られたので、このnoteはアンケート投票終了の3時間前の集計値で執筆しています。


このリーセンシーデータさえあれば、ガンマ・ポアソン・リーセンシー・モデルの分析によって需要を構造的に把握できます。


Excelで分析

ここからは、本書で紹介されていた数式を実装したExcelシートを使って説明します。本書で紹介されていた負の二項分布の数式で回数別の浸透率(Pr)を計算します。

NBDモデル

これは当該期間(ここでは1年)において、その行為を行う人(ここではプレゼント・キャンペーン応募)の割合を示すものです。これは、MとKの2つのパラメーター(係数)によって求められます。

(同書P59 より引用)Mは、自社ブランドを全ての消費者が選択した延べ回数を消費者の頭数で割ったものです。

まず、Kを1に固定したまま、Mを1→5→10と変更してみます。

画像9

Mを変えると、オレンジ色の回数別の浸透率の予測値が変化し、それを元に集計した浸透率0回の人数(赤色)、浸透率1回以上の人数(ピンク色)、のべ回数(緑色)の値も変化します。ここでは母集団は日本国民の数(約1.2億人)としています。母集団×M=のべ回数です。

線グラフの「11」は、「11回」の集計値ではなく、「11回目以上」の合計値です。

次は、Kを変化させてみます。

(同書P60 より引用)Kは、消費者の購入確率がどのような分布の形になるかを決めている指標です。

Mを5に固定したまま、Kを1→5→10と変更してみます。Kは分布の形が変わるだけですので、のべ回数(緑色)に変化はありません。それ以外の値が変化します。

画像9


今度はKを1に固定したまま。Mを1→5→10と変更してみます。同じエクセルシートの上部にある「黄色いセル」の値の変化に注目下さい。これは

期間別の浸透率(Pn)

の予測値です。

画像9


期間別の浸透率(Pn)は、任意の期間で当該アクション(ここではプレゼント・キャンペーン応募)を行った人の割合を求めるものです。MとKの2つのパラメーターが決まれば、予測値を導くことができます。

「確率思考の戦略論」P277~P280の巻末付録のガンマ・ポアソン・リーセンシー・モデルの解説に期間別浸透率と、それを求める式についての説明があります。


これを「最後にいつ◯◯しましたか?」という質問に寄って得られたリーセンシーデータ、すなわち期間別の浸透率の実績値とシンクロさせます。

リーセンシーデータの実績値と予測値の誤差を最小化となるMとKを計算によって求めます。

※正確には誤差の平方和を最小化します。

本書でも紹介されているExcelの最適化計算ツールのソルバーで計算できます。

画像6


計算から得られた結果が下記です。これは1年間におけるMとKを求めた場合です。

分析結果①

これは1ヶ月間のMとKを求めた場合です。

分析結果②

MとKが判明したため、1年間でのキャンペーン・プレゼントの応募のべ回数(緑色)は13.9億回で1ヶ月の場合は、◯◯回であると推定できました。

ただし、この結果を日本国民の年間の応募数と解釈するには、注意すべき点(突っ込みどころ)が大きく2つあります。


注意すべき点

今回は、自粛のまっただ中(2020年4月28日)の調査であることによる過大推定(プレゼント・キャンペーンに応募する機会が増えていること)と、標本が母集団を代表するものとはなっていないことです。(アクティブなツイッターユーザーの偏った特性によるバイアスが生じている可能性があります)


注意点①いつ聞くか?

例えば、フライドチキンの需要把握のためにリーセンシーデータを調査するとき、1月1日に調査する場合と12月1日に調査する場合で、大きく結果が変わります。フライドチキンはクリスマスに爆発的に売れるため、前者のほうが圧倒的に最後の購買が直近である方の割合が増えます。1月1日の調査を元に年間を推計するのは過大推定となってしまいます。

ただ、これを逆手にとり、いつ調査するか?によって変わるリーセンシーデータによって変わるMとKの値の違いから、月ごとの需要の変化を知ることができます。

おそらく、同書で紹介されていたハロウィーンに注力する意思決定はこうした月次での需要把握によるものではないか?と私は考えています。


注意点②誰に聞くか?

(日本国民の)代表性を担保する調査は無作為抽出による郵送調査などが望ましいですが、膨大な金額と時間がかかります。そこでコストとスピードに勝るツイッターで調査しました。ただし、私のフォロワーを中心に回答を得ても標本が偏るため、なるべく偏りを減らすため、地域「日本」言語「日本語」という指定でプロモツイートを配信しました。日本国民の代表ではなく「アクティブなツイッターユーザー」の代表です。広告配信はエンゲージメント獲得単価で3円で入札開始して配信が周り出してから2円、1円と入札単価を下げて配信しました。厳密には、プロモツイート配信のアルゴリズムにより、エンゲージメントしやすい方に偏っていると思います。


消費者調査のバイアスを考慮するための方法を詳しく知るには下記のマーケティングリサーチ入門がオススメです。


少し見方を変えて、母集団を全国民ではなく、ツイッターアクティブユーザーとして月次(より正確には4月28日以前の31日間)の需要構造把握と捉えた場合は、ある程度正確性が担保された分析になると考えます。ツイッターアクティブユーザー数は下記の記事を参照し4,500万人としました。


母集団をツイッターアクティブユーザー4,500万人に変更した結果が下記です。(MとKの対象期間は1月間の場合)

分析結果④


2020年4月28日より前の1ヶ月間でツイッターアクティブユーザーがプレゼント・キャンペーンに応募した回数(のべ)はおよそ6,234万回(緑色のセルの値)でした。各回数別浸透率によって、「キャンペーン・プレゼント応募」の需要を構造的に把握できました。

なお、調査会社が一部無料で公開してるデータで、キャンペーン応募頻度に関するものも見つけました。この調査データのように、当該サービスの利用頻度を聞いたアンケートデータからMとKを計算することもできます。


調査は1年前(2019年4月1日~5日)に実施されたもので、上記の調査を参照して分析しました。分析結果は以下です。(MとKの対象期間は1年間の場合)

分析結果③

ここでは詳細な説明を控えますが、マイボイスコム(MyEL)の公開調査から得られた回数別浸透率の実績値と予測値の差分(差分の二乗和※紫色のセルの値)を最小にするMとKをソルバーによって計算しています。


分析結果を比較します。

昨年調査 (2019年4月MyEL)MとKの対象期間(年間)
M=6.679 K=0.263 

今年調査 (2020年4月Twitter)MとKの対象期間(年間)
M=16.31 K=0.227

Mの値が大きく乖離しています。これはおそらく、自粛により家にいる時間が増え、プレゼント・キャンペーンの応募機会が増えていたことが考えられます。標本の性質の差(ネットモニターとツイッターユーザーの差)によるものも若干あると思います。

事態が収束したら再びTwitterでリーセンシー調査を行って分析し、月次でのMとKから需要構造を比較してみたいところです。


まとめ

調査するタイミングによって、リーセンシーデータが変わるため、その時点を起点にして1ヶ月前など、任意の期間で需要を把握できるのがガンマ・ポアソン・リーセンシー・モデルの醍醐味です。

また、今回ツイッター調査でスピーディに安く標本が得られることが分かりました。20代男性女性、30代男性女性といった10代性年別刻みでの調査や東名阪とそれ以外などのセルを分けた調査を行うなど、特定の調査テーマでツイッター調査を行ってまたnoteを書いてみたくなりました。よろしければスキやシェア、知りたい調査テーマなど、noteコメントまたはツイッターでご意見を頂けますと幸いです。

現時点での私の案としては、この状況でもなお業績好調のケンタッキーフライドチキンのテイクアウトや、宅配ピザや宅配またはテイクアウト寿司の需要の変化などが、気になっています。

追加情報(2023年12月23日更新)

マーケティング・アナリストとして、どんな価値を提供しているのか?紹介しております。



この記事が参加している募集

私のイチオシ