顧客の潜在的な購買特性を加味したpLTV
電通デジタルで機械学習エンジニアをしている今井です。
本記事では、顧客の潜在的な購買特性を加味してLTV(life time value)を予測するための統計モデルについて紹介します。
こちらは大阪大学 櫻井研究室との産学連携において開発されたモデルです。
顧客の潜在的な購買特性を検出する
pLTVモデルは、RFM指標(Recency, Frequency, Monetary)を用いてLTVを予測する統計モデルです。
詳しくは過去記事[1]にまとめています。
本研究では、例えば「夏季/冬季, 平日/休日」といった時系列による特徴的な購買行動を抽出することで、マーケティング的な示唆出し、およびpLTVの精度改善を実現します。
提案手法では、各顧客の購買行動を商品カテゴリ, 時系列(購入日)の両面から分析し、いくつかの重要なトピックに分類します。
具体的には、購買ログを顧客ID(𝑢), 商品ID(𝑣), 購入時間(𝑛)の3階テンソルとして表現し、潜在トピックの数を 𝑘 としたとき、テンソル X を顧客ID, 商品ID, 購入時間に対応する3つの行列 𝐀(𝑢×𝑘), 𝐎(𝑣×𝑘), 𝐂(𝑛×𝑘) に分解します。
行列 𝐎 では関連性の高い商品カテゴリが同一トピックに割り当られています。
通販サイトomni7 の購買ログを使った実験結果がこちらです。
Topic2は女性向け商品のトピック、Topic3は青少年向け商品のトピック、Topic8は食品関連のトピックなど、かなり高精度に分類できていることがわかります。
行列 𝐂 では、類似する時系列パターンをもつ商品カテゴリが同一トピックに割り当てられています。
例えば、Topic3は7月と12月にかけて購買数が上昇する季節性をもつトピックであり、上記より青少年向け商品のトピックであるため、長期休暇の時期に買われやすいことがわかります。
「どのような商品がどの時期に買われやすいのか」という情報はマーケティング戦略を立てる上でも非常に有用な示唆となります。
潜在トピックを用いたLTV予測
次に、推定した潜在トピックをpLTVに用いることで予測精度の改善を行います。
行列 𝐀 内の 𝑘 次元のベクトル 𝐚 は、ある顧客における各トピックとの関連度の強さ、すなわち、潜在トピック空間において各ユーザの特徴を要約したものとなります。
これらと重み係数 𝐰 を用いてpLTVのモデルパラメータ 𝜃 ∈ {𝑟,𝛽,𝑔,ℎ,𝜏,𝑞,𝜉} を表現します。
2018年12月31日までの購買ログを用いてモデルの学習を行い、2019年1月1日から1年間の予測LTVを算出し、実LTVとの差(mean absolute error, MAE)を比較すると、提案手法(TBTYD)がRFM指標のみの従来手法(BTYD)よりも20%近く精度改善しました。
本記事は、人工知能学会全国大会2020に投稿した論文を要約した内容となっています。
より詳しく知りたい方は参考文献[2]や発表スライドを一読ください。
参考文献
[1] pLTV: 顧客生涯価値を予測する
[2] 川畑ほか, 大規模購買ログの時系列解析に基づくLTV予測, 2020