見出し画像

『確率思考の戦略論』に出てくるNBDモデル(負の二項分布)を学んでみた

1.この記事について

本記事作成の目的は『確率思考の戦略論』に出てくるNBDモデル(負の二項分布)の理解を深めることです。

また本記事は確率分布(二項分布、ポワソン分布、負の二項分布、ガンマ分布)に関する知識を踏まえて書いていますが、左記に関する定義や特徴の説明は割愛しています。

代表的な確率分布の特徴まとめ(Qiita @qiita_kuru(くる))


確率・統計観点でさらに詳細を知りたいという方はqiita_kuruさんの記事、統計web上の各記事、『確率思考の戦略論』の巻末解説を参照ください。

2.NBDモデルについて

NBDモデルとは?
NBDモデルは『確率思考の戦略論』に出てくる統計モデルのひとつです。同モデルを活用することで、消費者行動を分析し、需要予測を行うことが可能です。

具体的には一定期間内の平均購入個数(※1)と購入確率の分布のパラメータ(※2)を求めることで市場全体(消費者)から創出される売上を推計します。

※1.NBDモデル上のMを指します。
※2.同モデル上のKを指します。

統計学上の「負の二項分布」とは違う
ちなみにNBDとはnegative binomial distributionの略で、統計学の文脈では「負の二項分布」という確率分布ですが、『確率思考の戦略論』で登場するNBDモデルはマーケティング文脈向けにカスタマイズされており、統計学のそれとは異なります。

NBDモデルが適用できる商材は?
適用できる商材カテゴリ(同じ目的で使用され、同じような方法で便益を与える製品・サービスの集まり)は小売り消費財産業製品で活用実績があり、適用できそうです。

また『確率思考の戦略論』の中では米国の数学者で経営学者のアンドリュー・アレンバーグ氏がまとめた論文を引用しつつパンケーキ、
歯磨き粉などが事例として紹介されていました。

その他事例として、デーサイエンスティストSKUEさんのブログ記事『ディリクレNBDモデルのマーケティング分野での適用に関して色々調べてみた』の中で『ディリクレモデルの境界条件 ― サービスへの適用可能性と限界 ―』という論文が紹介されていました。

上記を参照すると銀行市場、クレジットカード市場、ガソリンスタンド市場、スーパーマーケット市場、テレビ番組市場、ファーストフード市場、オーケストラ市場、フットボールリーグ市場、野球市場などのサービス業や、スポーツウェアや自動車などの市場においても適用可能性がありそうです。

3.NBDモデルを白玉と赤玉を壺から取り出す実験で例えてみる

同モデルを理解しやすくする為、確率分布の説明でよく出てくる白玉と赤玉を壺から取り出す例で考えてみたいと思います。

例:白玉と赤玉を壺から取り出す実験
壺の中には白玉赤玉合わせた合計n個の玉が入っています。赤玉はθ個,白球はn-θ個入っています。

その中から玉を無作為に取り出し,選んだ玉を壺に戻した上で選んだ玉と同じ色の玉をd個壺に加えます。

この試行をN回繰り返す時、r回赤玉が出る確率を考えます。

数学の文脈では「ポリヤの壺」と呼ばれる問題


例からNBDモデルの特性を捉えてみる

上記の例をNBDモデルにに置き換えて考えると「赤玉を取り出す」という行為は「商品が購入される機会」を表しています。

そしてN回中赤玉が出る平均回数が「一定期間での平均購入個数」を表現しています。

また「選んだ玉を壺に戻した上で選んだ玉と同じ色の玉をd個壺に加える」という事象はある商品を買った顧客が再びその商品を買う確率が高くなるということを表しています。

つまり、最初に商品を購入した顧客(赤い球を取り出した)は、再購入(赤い球を壺に追加する)の機会が増えるわけです。

このようにNBDモデルは二項分布やポアソン分布では捉えることができなかった消費者行動の特性[選択自体が次の選択に正の影響を与えるという点(=成功が成功を呼ぶガンマ分布)]が加味されています。

4.NBDモデルの数式について

統計モデルの数式はこちら
『確立思考の戦略論』に登場するNBDモデル数式は下記です。

続いて各記号やパートの意味について触れます。

統計モデルの数式解説
ここでは同書説明とyoutube数式解説チャンネルの動画をベースにまとめています。

上記で各記号とパートが何を意味しているのか?理解頂けると思います。

数学的な説明詳細が気になる方は同書239ページ以降の巻末解説1をご確認ください。

5.パラメータMについて

NBDモデルはMとKという2つのパラメータ(※)で表すことができます。重要な概念なので、本パートで意味を整理したいと思います。まずMから説明します。

※パラメータ(parameter)
数学で、変数間を媒介する変数。 たとえば、x=f(t), y=g(t) がtの関数ならば、tの値に応じてx、yの値が定まり、x、yの関係も明らかになる。 このようなとき、tをパラメータという。

Mとは何か?
Mとは一定期間での平均購入個数を指します。
『確率思考の戦略論』の中では「自社ブランドを全ての消費者が選択した延べ回数(累計数)を、消費者の頭数で割ったもの」と説明されています。

白玉と赤玉を壺から取り出す例で出てきた記号を用いてMを数式化すると下記になります。

玉を取り出す回数N回中、赤玉が出る平均回数(赤玉θ個/玉の合計n個分)

なぜMが重要なのか?
NBDモデルにおいて、Mは一定期間内に顧客が平均してどれだけの商品を購入するかを示しており、企業が市場から創出できる売上規模を理解するのに重要な役割を果たします。

またMは顧客の購買行動の全体像を描き出すのに役立ちます。

ブランドのMを改善するという事はブランドの質的成長(プレファレンスを改善)か量的成長(認知と配荷の改善)により、下記赤字部分の
指標を改善させることを意味します。

赤字①は商品・サービスの利用者を増やす水平拡大を指し、赤字②③は商品・サービスの利用頻度を増やす垂直拡大を指す

【補足】Mが購買行動に関わる各指標の影響結果であることが分かるExcel表
例として表を作り、ブランドのMを算出してみました。

【ブランドMの算出例】A,C,D,Eはサンプル数値です

Mは"B.浸透率(一定期間内に1回以上商品を買ったことがある人の割合)"と"C.月平均購入回数"と"D.一回あたり平均個数"が掛け合わされた数値です。

またMは"C.月平均購入回数"×"D.一回あたり平均個数"×"F.一定期間内に1回以上商品を買ったことがある人の延べ人数(累計人数)"を掛け合わせた合計購入個数を"A.市場全体の人数"で割ることで算出することが可能です。

Mが購買行動に関わる各指標の影響結果であり、ブランドがMを増やすという事は売上増加に直結していることが分かります。

プレファレンスはMを指す?
『確率思考の戦略論』の中で整理が難しい点の1つがプレファレンスとMの関係性です。同書の中では同じ意味のように解釈できるシーンがあります。

識者との意見交換や本書の再読を踏まえて整理した私の見解は下記です。

①プレファレンス(相対的な好意度)とM(一定期間での平均購入個数)は密接に関係している。

②プレファレンスが上がれば、Mも上がる関係性にあり、市場構造を決定づけている本質は「消費者のプレファレンス」である。

③ただ、プレファレンス=Mではない。本書内で「自社ブランドのプレファレンスの総和としてのMを増やす選択を取り続けることが重要」と語られていることから意味は異なる。

④ちなみに、プレファレンスそれ自体は可視化できない。プレファレンスとは要は好みであり、個人の主観的な感情や意見に関連する要素。数値化や可視化が難しい。

⑤一方で、ディリシュレーNBDモデルを使った「ブランド間のシェア」や NBDモデルに出てくる「M」を指標として活用することで間接的にプレファレンスを可視化はできる。

以上です。

ちなみに余談ですが、実際のマーケティング業務において、プレファレンスよりもMの改善に集中しているマーケターもいるらしく、事業が置かれている状況によってはプレファレンスの改善優先度を落とすケースがあるのかなと思いました(認知や配荷に集中する等)。

6.パラメータKについて

Kとは何か?
Kとは購入確率の分布のパラメータです。

一定期間内にr回商品を買う人をグラフで表した時の凸度や形状を決めているのがKです。

『確率思考の戦略論』の中ではKは、「消費者の購入確率がどのような分布の形になるかを決めている指標」と説明されています。

Kを説明する数式は下記です。

K=θ/dにおける「d」は伝染力の変数のようなもの

θは全顧客の購入回数、dは購買行動の分散(顧客間の購入頻度の違い)を示します。

dは消費者行動に影響を与える伝染力の変数のようなものと考えてください。

Kにおける凸度について
NBDモデルでは、Kはdに逆比例します。

下記の例をもとに考えてみましょう。
θが一定の場合、dが大きいほど、Kの値は小さくなります。

【例】θが2で一定の時、dが大きければ大きいほどKの値は小さくなる

Kの値が小さくなる場合、購入行動の分布は、ほとんどの顧客が少ない回数(0回または1回)の購入に集中する形になります。

サンプルとしてKを「20」と「1」にしてヒストグラム図を作ってみました。Kが小さくなる場合の顧客購入回数の変化を見てみましょう。

ex.M=1、K=20の場合

【例】M=1、K=20の場合

ex.M=1、K=1の場合

【例】M=1、K=1の場合

K=1とK=20を比較するとグラフの凸度が変化していることが分かります。

Kの値が大きいということは、dが小さく「その商品を買ったことがある人が多い」、「市場に出て期間が経過しており頻繁に商品購入するファンがすでに多くいる」状態と言えるのではないでしょうか。

逆にKの値が小さく、dが大きい場合は「あまりみんな買っていない」や「市場に出て期間が経っていない」、「少数だが熱烈なファンがいる」状態と考えられそうです。

7.NBDモデルを使って分析してみる

【前提①】方法論の把握

まず具体的な方法論については
下記記事・動画・講座を参考にしました。

【前提②】Excel活用に関して

計算はExcelソルバーとNBDモデル(負の二項分布)で登場する式を当てはめた関数を使い分析を行っています。

また今回の分析にあたって、表 孝憲さんの『「確率思考の戦略論」を理解しエクセル予測モデルを使えるようになる!』という講座に参加し、エクセル予測モデルを学びました。大変参考になりました。

【前提③】分析対象について

私がフリーランスITエンジニア向け案件紹介サービスの運営に携わっている事もあり、今回はgeechs社(東京証券取引所スタンダード市場上場)IT人材事業について分析を行いたいと思います。

【計算】Mを算出する

まず、Mを求めます。フリーランスITエンジニアの人口は279,812人とします。2023年3月期のIR資料から月間の案件成約数(フリーランス個人と法人案件のマッチング数)は1,372件なので、M=0.0049と考えられます。

Mは下記2つの算出方法から数値を出しています。

算出方法①
M=月間の案件成約数(フリーランス個人と法人案件のマッチング数)÷市場全体の人数(フリーランスITエンジニアの頭数)

算出方法②
M=浸透率(geechs経由で1ヶ月以内に1回以上案件参画したことがある人の割合)×1ヶ月平均のgeechs利用回数×geechs利用1回あたりの平均成約案件数

【計算】Kを算出する

次にKを求めます。

Kはさきほど前段で求めたMと浸透率(geechs経由で1ヶ月以内に1回以上案件参画したことがある人の割合)とNDBモデルの数式をベースにExcelのソルバーで導き出します。

具体的には下記NBDモデルのrが0になる確率を求める時、数式が簡単に計算できるので左記特性を利用し、Kを算出します。

NBDモデルの数式(再掲)

NBDモデルのrが0になる確率を求める時、下記の通り計算がシンプルになります。その上でMとP0=1-浸透率を使えばKが求まります。

Excelのソルバーを使ってKを導きます。

セル番号E5に入っている関数は「=(1+(C3/C6))^(-(C6))」です

ここまででMとKが求まりました。

あとはMとKの数値(画像セル番号C2、C3)と、NBDモデルの数式を入れた関数(画像D列)を使い、1か月以内にr回以上案件成約が生まれる確率を見ていきます。

【示唆】マーケティング施策の方向性を考える

geechsがIT人材事業の売上をさらに伸ばす為には①新規ファンを獲得していくために水平方向にプレファレンスを強化する方が良いのか?②既存ファンの投票数を増やすプレファレンスの垂直拡大、どちらを選ぶと良いでしょうか。

私自身はNBDモデルの分析(仮説)を正として考える場合、①が良いと思いました。

なぜならgeechs社のIT人材事業は市場全体の人数(フリーランスITエンジニアの頭数)に対して浸透率にかなり伸びしろがある状態だからです。

geechsの案件紹介サービスを使ったことがある人の数よりも、使ったことがない人の数がかなり多いです。

『確率思考の戦略論』の中でも森岡氏は水平拡大のほうが成功しやすいと語っています。

新規ファンを獲得していくために水平方向にプレファレンスを強化する方が良いのか?あるいはもうすでに投票している人に 1人当たりの投票数を増やしてもらうための特別なファンサービス等を行って垂直方向へプレファレンスを強化する方が良いか?

私の経験上では、プレファレンスの垂直拡大よりも、水平拡大の方が成功する場合が多い気がします。どちらがもっとMが増えるのかを計算すると、水平方向が簡単である場合が多いのです。

主な理由の 1つは、既存のユーザーを深掘りするよりも、その外を耕す方がマーケットがずっと大きい場合が多いからです。

『確率思考の戦略論』より

NBDモデルを活用した分析と示唆は以上になります。

8.専門用語について

ここではNBDモデルを扱う上で、
頻出する用語の定義を整理しておきます。

浸透率
浸透率(英訳penetration rate)は特定の期間に何人がそのブランドを少なくとも1回買ったかを記録する指数。

浸透率=一定期間内に1回以上商品を買ったことがある人÷市場全体の人数で算出できる。

プレファレンス
英語Preferenceは名詞で(他よりも)好むこと・好みを意味する。

同書内でプレファレンスは、消費者のブランドに対する相対的な好意度と説明されている。簡単に言えば「好み」と考えられる。

プレファレンスは主にブランド・エクイティー、価格、製品パフォーマンスの3つによって決定されているとのこと。

また『確率思考の戦略論』の中では自社ブランドのプレファレンスの総和としての「M」を増やす選択を取り続けることが重要と語られている。

確率理論の導入とプレファレンスの数学的説明で出てくる記号一覧

『確率思考の戦略論』巻末解説より
『確率思考の戦略論』巻末解説より

以上です。
引き続き勉強を続けます。

この記事が参加している募集

仕事について話そう

この記事が気に入ったらサポートをしてみませんか?