顧客の潜在的な購買特性を加味したpLTV

2020年6月24日 10:00

電通デジタルで機械学習エンジニアをしている今井です。
本記事では、顧客の潜在的な購買特性を加味してLTV（life time value）を予測するための統計モデルについて紹介します。
こちらは大阪大学櫻井研究室との産学連携において開発されたモデルです。

顧客の潜在的な購買特性を検出する

pLTVモデルは、RFM指標（Recency, Frequency, Monetary）を用いてLTVを予測する統計モデルです。
詳しくは過去記事[1]にまとめています。

本研究では、例えば「夏季/冬季, 平日/休日」といった時系列による特徴的な購買行動を抽出することで、マーケティング的な示唆出し、およびpLTVの精度改善を実現します。

スクリーンショット 2020-06-19 12.56.22

提案手法では、各顧客の購買行動を商品カテゴリ, 時系列（購入日）の両面から分析し、いくつかの重要なトピックに分類します。

具体的には、購買ログを顧客ID（𝑢）, 商品ID（𝑣）, 購入時間（𝑛）の3階テンソルとして表現し、潜在トピックの数を 𝑘 としたとき、テンソル X を顧客ID, 商品ID, 購入時間に対応する3つの行列 𝐀(𝑢×𝑘), 𝐎(𝑣×𝑘), 𝐂(𝑛×𝑘) に分解します。

スクリーンショット 2020-06-24 17.17.38

行列 𝐎 では関連性の高い商品カテゴリが同一トピックに割り当られています。
通販サイトomni7 の購買ログを使った実験結果がこちらです。

スクリーンショット 2020-06-19 13.23.18

Topic2は女性向け商品のトピック、Topic3は青少年向け商品のトピック、Topic8は食品関連のトピックなど、かなり高精度に分類できていることがわかります。

行列 𝐂 では、類似する時系列パターンをもつ商品カテゴリが同一トピックに割り当てられています。
例えば、Topic3は7月と12月にかけて購買数が上昇する季節性をもつトピックであり、上記より青少年向け商品のトピックであるため、長期休暇の時期に買われやすいことがわかります。

スクリーンショット 2020-06-19 13.29.05

「どのような商品がどの時期に買われやすいのか」という情報はマーケティング戦略を立てる上でも非常に有用な示唆となります。

潜在トピックを用いたLTV予測

次に、推定した潜在トピックをpLTVに用いることで予測精度の改善を行います。

行列 𝐀 内の 𝑘 次元のベクトル 𝐚 は、ある顧客における各トピックとの関連度の強さ、すなわち、潜在トピック空間において各ユーザの特徴を要約したものとなります。
これらと重み係数 𝐰 を用いてpLTVのモデルパラメータ 𝜃 ∈ {𝑟,𝛽,𝑔,ℎ,𝜏,𝑞,𝜉} を表現します。

スクリーンショット 2020-06-19 13.50.56

2018年12月31日までの購買ログを用いてモデルの学習を行い、2019年1月1日から1年間の予測LTVを算出し、実LTVとの差（mean absolute error, MAE）を比較すると、提案手法（TBTYD）がRFM指標のみの従来手法（BTYD）よりも20%近く精度改善しました。

スクリーンショット 2020-06-19 13.57.33

本記事は、人工知能学会全国大会2020に投稿した論文を要約した内容となっています。
より詳しく知りたい方は参考文献[2]や発表スライドを一読ください。

参考文献

[1] pLTV: 顧客生涯価値を予測する
[2] 川畑ほか, 大規模購買ログの時系列解析に基づくLTV予測, 2020

みんなにも読んでほしいですか？

オススメした記事はフォロワーのタイムラインに表示されます！