【学びメモ】Tableau フィルタのかけ方が複数パターンとれる場合の使い分け
クエリパイプラインの勉強会に参加!メインテーマではなかったがQAを聞く中でDATASaberのOdr3 Q6を解いていた時の疑問が解消されたので定着のために整理。
疑問点
サンプルスーパーストアで例えば「利益が30万以上の地域の売上は?」という問いがあるとき下記2つのパターンのフィルタが思いつく。どちらでも同じVizになるがどちらの方がいいのだろうかと疑問だった。
パターン①利益に対し30万以上のフィルタ設定をする
パターン②地域に対し条件フィルタで利益が30万以上を設定する
フィルタの使い分け
この「利益が30万以上の地域の売上は?」の問いに答えるだけであるならば、どちらも変わらない。でも次のアクションとして年別に状況を見たいとなると動作が変わる。
(1)前提の確認
各地域の利益の状況を先に見ておこう。
全期間でみると北海道だけが30万円より小さい利益となっている。
年別にみると、北海道はどの年も30万円より小さい利益となっている。中部地方は2013年だけ30万円より小さい利益となっている。ほかの都市はどの年も30万円以上である。
(2)それぞれのパターンで年別にみた結果
分かりやすいように中部地方をオレンジにしている。
パターン①では、各年ごとの利益合計に対し30万円以上のフィルタが適用され2013年のグラフには、中部地方が表示されない。一方で、パターン②では、全期間の利益合計に対し30万円以上のフィルタが適用されるため、30万円より小さい利益となっている2013年の中部地方の売上も表示されている。
(3)動作の違いの理由
Tableauの計算順序であるクエリパイプラインに照らすとこの動作の違いがわかる。クエリパイプラインに当てはまると、下記となる。
パターン②では、Vizで選択したオーダー日の年を考慮する前にフィルタ済みなのである。
パターン②:条件フィルタ
↓
Viz-LODに応じた集計
↓
パターン①:メジャーフィルタ
(4)使い分け
メジャーフィルタを使う方がViz-LODが考慮されるため汎用的に感じた。一方で、あまりないシチュエーションに思えるが特定のディメンションについて全データに対する特定の条件で絞り徹底分析したい場合はディメンションに条件設定する方がいいだろう。
TableauでVizを作るとき、同じことを色々な方法で実現できるけど、それを利用する相手のことやその後の分析の広がりを意識して、どう実現するのが最適なのか考えて作らないといけないと実感する。最適判断のためにはまだまだ勉強が必要だな。
この記事が気に入ったらサポートをしてみませんか?