見出し画像

Alteryxでバスケット分析をしてみた

2019年11月に公開されたマッキンゼーの『Global AI Survey』の結果で、A I・機械学習のテクノロジーの導入により、企業におけるマーケティングとセールス(販売)の部門で 最も収益が増加した と結果が出ています。

画像6

(参照:McKinsey & Company "Global AI Survey" )

売上・利益に直結した機能を持っているマーケティングやセールスの部門で機械学習を応用することは、思っている以上にROIが高く、重要かもしれません。今回の記事では、そんなマーケティングやセールスの部門で使われる代表的な相関ルールを発見する分析手法で、やってみたいけど面倒臭そうと思われがちな「バスケット分析」を、Alteryxでやってみようと思います。(結論:簡単にできます)

バスケット分析とは

バスケット分析を知らない方もいるかもしれないので、お決まりの端的な説明をさせていただくと、バスケット分析は「この商品を買ったら、あの商品もあわせて買うよね」という傾向を理解するための分析です。この分析から、文字通り買い物カゴ(バスケット)に別々の商品を一緒に突っ込むパターンというか、頻繁に一緒に購入される傾向のある商品を理解します。(Wikipediaではバスケット解析と書かれていたり、併売分析と言われるのも聞く気がします。)実際の例では、おむつとビールの話が有名です。自分の会社の商品やサービスで、何と何が一緒に購入される傾向があるかが分かると思うとワクワクしますね。

Alteryxでワークフローを作ってみる

今回したいことは商品カテゴリのあるサンプルデータを使い、それぞれのカテゴリがどう併せて購入されているかを理解していこうと思います。始める前にデータに、トランザクションのID と カテゴリーや商品名があることを確認してください。(勿論、データ型がIDやカテゴリー名などがストリングになっている確認も忘れずに!)

データが準備できたら、Alteryx Designerでワークフローを作っていきます。以下のように、「予測グルーピング」のタブを開き、

画像6

「MBルール」ツール と 「MB検査」ツールの2つをを使っていきます。ツールの頭にある「MB」はマーケットバスケット(Market Basket)の頭文字ですね。わかりやすく買い物カゴのアイコンになってます。「MBルール」ツールの方は相関ルールを高速に見つけるために使用されるツールで、「MB検査」ツールの方は発見した相関ルールを、複数の基準でフィルタリングして、さらにデータの出力ができるようにしているツールです。

入力したデータに「MBルール」ツールを繋げ、左の設定パネルで以下の通り設定していきます:

画像3

① 入力データ構造
入力データのトランザクションキーフィールドに「オーダーID」を選択、アイテム識別子に「製品サブカテゴリー」を選択します。
② アプリオリ
今回は「アプリオリ」アルゴリズムを使用していきます。ここでは「関連付けルール」を選択します。(このアプリオリが高速に相関(関連付け)ルールを見つけるアルゴリズムです。)
③ コントロールパラメーター
「ルールの最低限必要なレベルの信頼度」がデフォルトで0.50になっていますが、少々高い設定なため、ここでは0.20まで下げます。(0.50のままだと出力されるデータも少なくなってしまう)

次は「MBルール」ツールのO(出力)のアンカーに、「MB検査」ツールを繋げます。用途に応じてフィルターの設定を変更してもいいのですが、今回は特に絞り込まずにデフォルトのままで進めます。ただ、赤線で囲ってある部分はリフトの値のフィルターですが、これは1より大きい値にしたいのでとりあえず1.1を入力します。(リフトの意味は下にまとめてあります。)

画像6

ただ、ここで「リフトって何?」「サポートって・・・」と用語の意味を知りたくなると思うので、私なりにまとめた定義を以下に記載します。:

•  LHS (Left-hand Side):データを突き合わせる時の元になる左側の商品
•  RHS (Right-hand Side):左側の商品と一緒に購入されているかを確認するために使う右側の商品
•  サポート (Support):LHSとRHSの商品を共に含むトランザクション数 / LHSの商品の総トランザクション数
2つの商品の組み合わせで同時に購入した割合。
•  信頼 (Confidence)=LHSとRHSの商品を共に含むトランザクション数 / 総トランザクション数
•  リフト (Lift):信頼 /サポート(リフトが高いほど相関関係が強い)
  
(参考:"Fast Algorithms for Mining Association Rules" - Rakesh Agrawal and Ramakrishnan Srikant

閲覧ツールを使って「MB検査」ツールのアウトプットを見ていくと、以下のような結果が閲覧できます。上のワークフローの通りCSVに出力していきます。これを最終的にBIツールなどを使って可視化していくと、分析結果が分かりやすいですし、活用しやすくなっていきます。

画像6

可視化する

Alteryxの「インサイト」ツールを使うと、データの可視化だけでなくダッシュボードを作成できます。Alteryx Serverを使ってチーム内に共有も可能です。今回はヒートマップを作成し、理解しやすくしました。(Alteryxのサンプルワークフローはここからダウンロードできます。ぜひ確認してみてください。)

画像6

施策に落とし込む

ここから分かることをもとに「ファーストフードのセクションには必ず冷たいドリンクのコーナーを併設する」とか、「ベーカリーのセクションでホットドリンクを一緒に販売する」などの施策が導き出せるかと思います。冒頭で触れたように、機械学習やAIの導入による著しい効果も、今回のような相関ルールの発見をするだけでなく、分析からどのような行動に落とし込んでいくのかしっかりと判断し、実行することによって売上・利益の向上に繋がっていくと思います。バスケット分析はそんな施策に繋げやすいひとつの分析の例かもしれません。

この記事が気に入ったらサポートをしてみませんか?