見出し画像

[プロンプト有]ChatGPTで未来予測をするNBDモデルを動かす - マーケティング

「確率思考の戦略論」という本があります。マーケティングのお仕事をしている方なら、ご存じの人も多い森岡 毅さんが書かれた名著です(今西聖貴さんとの共著)。2016年に初版が発行されており、私も読みましたが、数学の知識が乏しい私には、数式を理解することは困難でした。
今では、ChatGPTなどの対話型生成AIがあるので、あらためて読み返し、理解を深めたいと思っています。

本記事では、「確率思考の戦略論」で紹介されているNBD(Negative Binomial Distribution)モデルを使用して、ECサイトの次月の購入件数を予測する例を通して、予測結果を活用したマーケティング戦略の立案方法についてみていきます。


NBDモデルとは?

NBDモデル(Negative Binomial Distributionモデル)は、マーケティングの世界で特に顧客の購入頻度を予測するために使われる統計モデルです。このモデルは、顧客が一定期間内に何回購入するかを予測するのに適しています。

NBDモデルの基本概念

まず、NBDモデルとは何かを理解するために、基本的な概念から見ていきます。

二項分布と負の二項分布

  • 二項分布:これは、ある特定の試行(例:コインを投げる)の成功回数をモデル化するための分布です。例えば、コインを10回投げて、何回表が出るかを計算するのに使います。ここで「成功」とは「表が出ること」です。

  • 負の二項分布:これは、二項分布の成功回数がランダムに変動する場合をモデル化します。例えば、ある商品が月に何回購入されるか、その購入回数が月によって大きく異なる場合です。この変動を捉えるために、負の二項分布が使われます。

NBDモデルの構成要素

NBDモデルは、以下の2つの主要なパラメータで構成されています:

  • r(形状パラメータ):これは、購入回数のばらつきを示すパラメータです。rが大きいほど、データのばらつきが小さくなり、rが小さいほど、データのばらつきが大きくなります。

  • p(成功確率):これは、ある特定の期間内に購入が発生する確率を示すパラメータです。pが高いほど、購入回数が多くなる傾向があります。

なぜNBDモデルを使うのか?

NBDモデルは、特に顧客の購入頻度が大きくばらつく場合に有効です。以下に、NBDモデルを使用する理由を詳しく説明します。

  1. 現実的な予測: 顧客の購入頻度は月によって大きく異なることが多いです。例えば、ある顧客は1月に10回購入し、2月には1回も購入しないことがあります。NBDモデルは、このようなばらつきを捉えるのに適しています。

  2. マーケティング施策の最適化: 顧客の購入頻度を予測することで、個々の顧客に対して適切なマーケティング施策を実施できます。例えば、購入頻度が高い顧客にはロイヤルティプログラムを提供し、頻度が低い顧客にはプロモーションを行うことができます。

  3. 顧客セグメンテーション: NBDモデルを使って顧客の購入パターンを分析することで、顧客をセグメント化(グループ化)できます。これにより、各セグメントに対して適切なマーケティング戦略を立てることができます。

NBDモデルの具体的な適用例

具体的な適用例を見てみましょう。ここでは、ECサイトの購入データを用いて、NBDモデルを使った予測を試してみます。

Pythonスクリプトで実行する場合

PythonスクリプトでNBDモデルを使用した予測分析の方法を仮のデータを使って実施してみます。

データの収集: まず、過去の購入データを収集します。以下は、仮のデータ例です。

$$
\begin{array}{|c|c|c|c|} \hline
UserID & StartDate & EndDate & PurchaseCount \\ \hline
1 & 2024-01-01 & 2024-06-30 & 50 \\ \hline
2 & 2024-01-15 & 2024-06-30 & 45 \\ \hline
3 & 2024-02-01 & 2024-06-30 & 40 \\ \hline
4 & 2024-03-01 & 2024-06-30 & 20 \\ \hline
5 & 2024-04-01 & 2024-06-30 & 18 \\ \hline
6 & 2024-05-01 & 2024-06-30 & 15 \\ \hline
7 & 2024-06-01 & 2024-06-30 & 5 \\ \hline
8 & 2024-06-15 & 2024-06-30 & 4 \\ \hline
9 & 2024-06-20 & 2024-06-30 & 3 \\ \hline
\end{array}
$$

初期パラメータの設定: 次に、データの平均値と分散を計算し、初期パラメータを設定します。

import numpy as np

def calculate_initial_params(usage_data):
    mean_usage = np.mean(usage_data)
    variance_usage = np.var(usage_data)
    r_init = mean_usage**2 / (variance_usage - mean_usage) if variance_usage > mean_usage else 1
    p_init = mean_usage / variance_usage if variance_usage > mean_usage else 0.5
    return max(r_init, 0.01), min(max(p_init, 0.01), 0.99)

usage_data = [50, 45, 40, 20, 18, 15, 5, 4, 3]
r_init, p_init = calculate_initial_params(usage_data)
print(f"Initial r: {r_init}, Initial p: {p_init}")

パラメータの推定: 次に、最大尤度法を用いてパラメータを推定します。これにより、モデルがデータに最も適合するパラメータを見つけ出します。

from scipy.optimize import minimize
from scipy.special import gammaln

def neg_log_likelihood(params, data):
    r, p = params
    likelihood = (
        gammaln(data + r) - gammaln(r) - gammaln(data + 1)
        + data * np.log(p)
        + r * np.log(1 - p)
    )
    return -np.sum(likelihood)

result = minimize(
    neg_log_likelihood,
    [r_init, p_init],
    args=(np.array(usage_data),),
    bounds=[(0.01, None), (0.01, 0.99)],
    method="L-BFGS-B"
)
r_est, p_est = result.x
print(f"Estimated r: {r_est}, Estimated p: {p_est}")

次月の購入件数予測: 最後に、推定されたパラメータを用いて次月の購入件数を予測します。

next_month_prediction = r_est * (p_est / (1 - p_est))
print(f"Next month's predicted usage: {next_month_prediction}")

このように、NBDモデルを用いることで、顧客の購入頻度を予測し、効果的なマーケティング施策を計画することができます。モデルの理解と実装を通じて、データに基づく意思決定が可能となり、マーケティング戦略の精度を高めることができます。

Pythonコード全体

import numpy as np
from scipy.optimize import minimize
from scipy.special import gammaln

# データの準備
usage_data = [50, 45, 40, 20, 18, 15, 5, 4, 3]  # 仮の利用頻度データ

# 初期パラメータの計算
def calculate_initial_params(usage_data):
    mean_usage = np.mean(usage_data)
    variance_usage = np.var(usage_data)
    r_init = mean_usage**2 / (variance_usage - mean_usage) if variance_usage > mean_usage else 1
    p_init = mean_usage / variance_usage if variance_usage > mean_usage else 0.5
    return max(r_init, 0.01), min(max(p_init, 0.01), 0.99)

r_init, p_init = calculate_initial_params(usage_data)
print(f"Initial r: {r_init}, Initial p: {p_init}")

# 尤度関数の定義
def neg_log_likelihood(params, data):
    r, p = params
    likelihood = (
        gammaln(data + r) - gammaln(r) - gammaln(data + 1)
        + data * np.log(p)
        + r * np.log(1 - p)
    )
    return -np.sum(likelihood)

# パラメータ推定
result = minimize(
    neg_log_likelihood,
    [r_init, p_init],
    args=(np.array(usage_data),),
    bounds=[(0.01, None), (0.01, 0.99)],
    method="L-BFGS-B"
)
r_est, p_est = result.x
print(f"Estimated r: {r_est}, Estimated p: {p_est}")

# 次月の利用頻度予測(簡易な例としてポアソン分布を使用)
next_month_prediction = r_est * (p_est / (1 - p_est))
print(f"Next month's predicted usage: {next_month_prediction}")

ChatGPTを利用する方法

実務においては、Pythonスクリプトを実行するのは、環境構築など手間がかかります。ChatGPTを利用して、同じように分析してみましょう。
以下のプロンプトを使用してみてください。

# このコンテンツの前提条件
利用頻度に関する過去をもとに次月の利用頻度を予測します。

# このコンテンツの詳細
NBDモデルを用いて、次月の利用頻度を予測します。

# このコンテンツのゴール
NBDモデルのパラメータ(rとp)を推定し、次月の利用頻度を予測する

# 変数の定義
usage_data: ユーザの利用回数データ

# ゴールを達成するためのステップ
1. ユーザからデータの提供を受ける
2. データを確認する
3. 初期パラメータの設定
4. パラメータ推定
5. 予測を出力

# 手順の実行プロセス
python
import numpy as np
from scipy.optimize import minimize
from scipy.special import gammaln

# 初期パラメータの計算
def calculate_initial_params(usage_data):
    mean_usage = np.mean(usage_data)
    variance_usage = np.var(usage_data)
    r_init = mean_usage**2 / (variance_usage - mean_usage) if variance_usage > mean_usage else 1
    p_init = mean_usage / variance_usage if variance_usage > mean_usage else 0.5
    return max(r_init, 0.01), min(max(p_init, 0.01), 0.99)

r_init, p_init = calculate_initial_params(usage_data)
print(f"Initial r: {r_init}, Initial p: {p_init}")

# 尤度関数の定義
def neg_log_likelihood(params, data):
    r, p = params
    likelihood = (
        gammaln(data + r) - gammaln(r) - gammaln(data + 1)
        + data * np.log(p)
        + r * np.log(1 - p)
    )
    return -np.sum(likelihood)

# パラメータ推定
result = minimize(
    neg_log_likelihood,
    [r_init, p_init],
    args=(np.array(usage_data),),
    bounds=[(0.01, None), (0.01, 0.99)],
    method="L-BFGS-B"
)
r_est, p_est = result.x
print(f"Estimated r: {r_est}, Estimated p: {p_est}")

# 次月の利用頻度予測(簡易な例としてポアソン分布を使用)
next_month_prediction = r_est * (p_est / (1 - p_est))
print(f"Next month's predicted usage: {next_month_prediction}")

# ユーザへの確認事項
分析対象のデータを提供してください
データの形式が正しいか確認してください(ユーザID、利用開始日、利用終了日、利用回数)。
データに欠損値や異常値が含まれていないか確認してください。

# 例外処理
データに欠損値がある場合は、平均値で補完するか、その行を削除します。
初期パラメータが適切でない場合は、再度初期値を設定し直します。

# フィードバックループ
推定されたパラメータや予測結果に問題がある場合は、データの再確認や初期パラメータの再設定を行います。

# 成果物の生成
- 推定されたNBDモデルのパラメータ(rとp)。
- 次月の利用頻度予測結果。
- 予測結果に基づくマーケティング戦略の提案。

’’’
User:データを用意しました。次月の利用頻度を予測したいです。

プロンプトの使用方法

このプロンプトをChatGPTに入力すると分析対象のデータの提供を求められると思います。
分析対象のデータをチャット欄に入力するかCSVファイル等でアップロードします。
分析対象データを入力後に「実行」や「RUN」と入力するとChatGPTが分析結果を出力してくれます。
入力データの形式を変更するなどプロンプトを改編することで、NBDモデルを用いた利用頻度の分析と予測を効率的に実行できます。

予測結果を基にした確率思考のマーケティング

予測結果を活用して、顧客の購入頻度に基づいた具体的なマーケティング施策の例を用意してみました。予測結果を基に、高頻度利用者、中頻度利用者、低頻度利用者に顧客をセグメントした場合の施策案の例です。

高頻度利用者向け施策

  1. ロイヤルティプログラムの強化

    • 高頻度利用者には、特典やポイント制度を充実させ、さらに購入意欲を高めます。

    • 特別な割引や限定オファーを提供し、長期的な関係を構築します。

  2. パーソナライズドオファー

    • 過去の購入履歴に基づいて、個別にカスタマイズされた商品やサービスを提案します。

    • メールやアプリ内通知を活用して、特別なオファーを直接送信します。

  3. VIPプログラムの導入

    • 特定の高頻度利用者をVIPメンバーとして認定し、特別なイベントや先行販売などの特典を提供します。

中頻度利用者向け施策

  1. リテンションキャンペーン

    • 中頻度利用者には、再利用を促すためのキャンペーンを実施します。

    • クーポンや期間限定の割引を提供し、再購入の動機を与えます。

  2. 顧客教育

    • 商品やサービスの利便性や利用方法についての情報を提供し、利用頻度を高めます。

    • ウェビナーやオンライン講座を開催し、顧客の理解を深めます。

  3. フィードバックの収集

    • 中頻度利用者からフィードバックを収集し、彼らのニーズや不満を理解します。

    • 収集したフィードバックを基に、サービスの改善を図ります。

低頻度利用者向け施策

  1. 再アクティベーションキャンペーン

    • 低頻度利用者には、再び利用してもらうためのアクティベーションキャンペーンを実施します。

    • 特別なオファーや初回限定の割引を提供し、再利用を促します。

  2. コンテンツマーケティング

    • 顧客の関心を引くようなコンテンツを提供し、ブランドへの興味を喚起します。

    • ブログ記事や動画、ソーシャルメディアを活用して、商品の魅力を伝えます。

  3. 定期的なリマインダー

    • 定期的にリマインダーやニュースレターを送信し、ブランドの存在をアピールします。

    • 新商品やサービスの情報を定期的に提供し、関心を引きます。

まとめ

NBDモデルを活用することで、顧客の購入頻度を予測し、効果的なマーケティング施策を立案することができます。具体的には、以下のポイントが重要です:

  1. NBDモデルの理解

    • NBDモデルは、顧客の購入頻度がばらつく場合に特に有効です。

    • r(形状パラメータ)とp(成功確率)の2つの主要なパラメータで構成されます。

  2. パラメータの設定と推定

    • 過去のデータを基に初期パラメータを設定し、最大尤度法を用いて最適なパラメータを推定します。

  3. マーケティング施策の立案

    • 高頻度利用者、中頻度利用者、低頻度利用者それぞれに適した施策を立案し、実行します。

「確率思考の戦略論」で紹介されていたNBDモデルを紐解いてみました。
数学の知識が乏しくとも、ChatGPTと共創することで、高度な確率分析を利用したマーケティングが身近になり、施策成功の精度を上げることができるかもしれません。


この記事が気に入ったらサポートをしてみませんか?