見出し画像

pLTV: 顧客生涯価値を予測する

電通デジタルで機械学習エンジニアをしている今井です。
本記事では、顧客生涯価値を予測するための統計モデルについて紹介します。

pLTVの求め方

マーケティングにおける顧客評価のための重要な指標として顧客生涯価値(life time value, LTV)が広く使われています。
LTVを高精度に予測できるようになると、適切なマーケティング活動を通して優良顧客との長期的な関係構築が可能となります。

LTVを予測するにあたり、次のように要素を分解します。
pLTV = 生存確率 × 期待購買回数 × 期待購買金額
これらの3要素を推定するためのモデルとしてBTYDモデル[1]が提案されています。
BTYDモデルはECビジネスのような都度払いで売買が行われる取引を想定しています。

(サブスクリプション型のサービスでは期待購買回数と期待購買金額が一定であるため、生存時間解析などを用いて契約期間を推定することでpLTVを算出することができます。)

BTYDモデルではRFM指標を用いてLTV予測を行います。
RFM指標とはRecency(直近の購買からの経過日数), Frequency(観測期間中の購買回数), Monetary(平均購買金額)で、顧客の購買特性を集約した指標としても有用です。

画像1

ここでは、生存確率および期待購買回数の推定手法としてBG/NBDモデル[2], 期待購買金額の推定手法としてGamma-Gammaモデル[3]を紹介します。

BG/NBDモデルでは、購買回数にパラメータ 𝜆 のポアソン分布

画像2

顧客の離脱確率にパラメータ 𝜌 の幾何分布

画像3

を仮定し、𝜆 の事前分布をパラメータ 𝑟,𝛽 のガンマ分布

画像4

 𝜌 の事前分布をパラメータ 𝑎,𝑏 のベータ分布とします。

画像5

(0,𝑇] での購買回数が 𝑥、最終購買時刻が 𝑡𝑥 のとき、𝑇 での顧客生存確率は次のように算出されます

画像6

また、(𝑇,𝑇+𝑡] での期待購買回数は

画像7

と算出されます。
ここで、2𝐹1 はガウスの超幾何関数を表します。

Gamma-Gammaモデルでは、購買金額にパラメータ 𝜏,𝜈 のガンマ分布

画像8

を仮定し、𝜈 の事前分布をパラメータ 𝑞,𝜉 のガンマ分布とします。

画像9

(0,𝑇] での購買回数が 𝑥、平均購買金額が 𝑚 のとき、期待購買金額は次のように算出されます。

画像10

従って、モデルの学習時にはパラメータ 𝑟,𝛽,𝑎,𝑏,𝜏,𝑞,𝜉 を最尤推定などで推定し、予測時には顧客の購買実績から抽出した 𝑥,𝑡𝑥,𝑇,𝑚 とこれらのパラメータを使って (𝑇,𝑇+𝑡] でのpLTVを求めることができます。

これらの導出過程については[4]にまとめています。

pLTVの進化

BTYDモデルはRFM指標だけでpLTVを算出することができる優れた統計モデルです。
しかしながら、シンプルがゆえに実務においては物足りない点もでてきます。
そこで弊社では、pLTVを進化させるべくR&D活動を行っております。

その第一弾として、デモグラなどの顧客特性を加味させたモデルを2019年度人工知能学会全国大会に投稿しました。[4]

現在は、大阪大学櫻井研究室との共同研究を開始し、商品カテゴリ情報や季節トレンドを加味したモデルの開発を進めています。
プレスリリース: https://www.dentsudigital.co.jp/release/2019/0930-00411/

参考文献

[1] Schmittlein+, Customer Base Analysis: An Industrial Purchase Process Application, 1994
[2] Fader+, “Counting Your Customers” the Easy Way: An Alternative to the Pareto/NBD Model, 2005
[3] Fader+, RFM and CLV: Using Iso-Value Curves for Customer Base Analysis, 2005
[4] 今井ほか, RFM指標と顧客特性に基づくLTV予測モデル, 2019

みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!