Tableau Tips 2 【Tableau日記】

前回に引き続き、DataSaberに向けた技術課題を解いていく上で自分がつまづいた点を初心者の方のTipsとして書いていきたいと思います。
Tableauに出会って3ヶ月くらいですので、自分と同じ始めたての方はつまづくポイントになるかなと思い、共有していきたいと思います。

「カウント」と「個別カウント」の違いについて

今回私が詰まった問題は、以下のような問題です。
(DataSaber課題を解いていない方は、サンプル・データストアで次のような表示をしてみることをイメージいただけばと思います。)

初めて購入した顧客が、2回目に購入してくれるまでに何四半期空いていることが多いですか?

こちらの詳しい解説はKTチャンネルの方にありますので、興味がありましたら参照してみてください。(Q6)
DATA Saber Boot Camp Week6 "HandsOn - Advanced I"

こちらを
列:1回目と2回目の購入日の差を計算したディメンジョン
行:年および四半期
にそれぞれ入れることでヒートマップを作成しました。

ここまでは良かったのですが、私が疑問に思ったのは次のようなことです。

顧客IDで色付けするのは分かるんだけど、なんで個別のカウントなんだろう?
そもそも顧客IDって一意に定まるもののはずだし、カウントと個別カウントで同じ値になるんじゃないの?
→実際に両方試してみると値が違う…

確かに「カウント」と「個別のカウント」が違うのは知ってるし、重複を数えるのが「カウント」、重複は一つのものとしてカウントするのが「個別のカウント」であることは分かっていましたが、少し混乱していました。

こちらをTableauの有識者の方に質問し、自分なりに整理してみました。

・顧客と顧客IDは1対1の関係
・顧客IDと製品は1対多の関係
 (1人の顧客が封筒とシャーペンを買えば、同じ顧客IDで複数のレコードとなる)
・初めての購入でいくつ商品を買ったかどうかは今回の分析では見ておらず、購入日に注目している。
・その購入日に対して、顧客IDは1対1で対応させないと、購入した製品数まで考慮に入れてしまう。
→求めている差の単位はあくまで「購入」なので、それだけを取り出すことが必要(購入-製品までの粒度は不要)
・製品までの粒度が不要なので、購入を顧客IDでカウントするためには、個別のカウントでひとまとめにする必要がある。

考え方の流れをまとまりなく書いてみると、上記のようになりますね。

顧客に対して顧客IDは一意じゃんと考えていたのが今回の誤りの原因で、分析する切り口に対して顧客IDはどのような役割を持っていて、1対1なのか1対多なのかを考える必要があったわけですね。

図にしてみると、以下のようになるでしょうか。

スクリーンショット 2020-05-24 22.19.07

前回のTips 1もそうなのですが、データ分析においてはどの切り口で分析しているか、そしてデータ間の関係はどうなっているかをしっかりと考えて扱っていくことが重要だと再認識しました。
Tableauによるデータ分析を始めたての身としては、この辺りの視点が抜けていたので良い学びが得られました。

この記事が気に入ったらサポートをしてみませんか?