Tableau勉強復習ノート⑥データブレンティング

お疲れ様です。
本日はTableauで理解しておくべき概念⑤データブレンディングについて勉強したことを、自分の言葉で書いていこうと思います。
以下のブログを参考にさせていただきました。

ブレンディングとは何か

tableauで複数のデータソースを扱う時の機能。
「ブレンディング」は「リレーション」と似ている部分があるが、「リレーション」は完全に「ブレンディング」に置き換わる機能ではない。

データ結合したときに起きること

結合する一方のデータに売上データが複数ある時は結合するもう片方のデータは複数ある売上データのレコード分だけ結合されてしまう。

私は以前オリジナルのVizを作成しているときに、データ結合で壁にぶち当たった話をnoteで書いたことがあります。
データ結合すると同じようなことが起きてしまうようです。

「結合」と「ブレンディング」の違い

★結合
複数のデータテーブルをくっつけて一つのデータソースを作る
★ブレンディング
複数のデータテーブルをくっつけることはせず、別々のデータソースとして持ったまま両方のデータを利用できるようにする

ブレンディングしたデータをViz上で使う

ブレンディングしたデータはデータペインに表示される。
一番最初にviz上にドロップしたピルを持っているデータテーブルがプライマリデータとなる。プライマリデータソースは青色のチェックマークのアイコンが付く。
★プライマリデータソース→親テーブルのようなもの

プライマリデータ以外はすべてセカンダリデータになる。セカンダリデータテーブルにはオレンジ色のチェックマークのアイコンが付く。
★セカンダリデータソース→子テーブルのようなもの

プライマリデータテーブルの鎖マークの意味

セカンダリデータソースのフィールドがプライマリデータテーブルのフィールドとつながっている。共通のデータの切り口
という意味。
共通のデータの切り口がないと警告が表示される。
★リンクしているフィールド
には鎖マークのアイコンが付く。

ブレンディングは左外部結合

プライマリデータソース(こちらが優先) ←結合→ セカンダリデータソース
・プライマリデータソースにあるデータは全て残る。
・セカンダリデータソースにしかないデータは全て除外される。
・プライマリデータソースとセカンダリデータソースの鎖マークでつないだディメンションで左外部結合が行われる。

ブレンディングの便利な点

プライマリデータソースとセカンダリデータソースを別々のデータテーブルとして持っているので、それぞれのテーブルで自由に切り口(粒度)を切り替えて結合させることが出来る。
結合とはデータの持ち方が違うので違うデータの見せ方が出来る。

ブレンディングの共通の切り口にする方法

できればこの方法が良い。フィールドの名前をプライマリデータソースとセカンダリデータソースで同じ名前にする。

②セカンダリデータソースのフィールドを複製して、プライマリデータソースと同じ名前のディメンションを作成する

③データタブ → ブレンドリレーションシップの編集 → カスタム
で設定する。

ブレンディングの注意点

①プライマリデータソースとセカンダリデータソースでディメンションの中の値の名前に違いがある場合、Viz上に値が表示できない。
ディメンションのピル下向き▼から別名の編集で名前を合わせないといけない。

②計算フィールドでのセカンダリデータソース利用
プライマリデータソースのフィールドとセカンダリデータソースのフィールドを使って計算フィールドで作る時
セカンダリデータソースのフィールドを計算式にドロップすると自動的に集計計算が行われた状態になる。
プライマリデータソースは集計か非集計かを選べる。
つまりプライマリデータソースとセカンダリデータソースで非集計の行レベル集計はできない。

★元々ブレンディング機能とは、共通の切り口(リンクフィールド)でプライマリデータソース、セカンダリデータソース双方を集計して合わせる動作だから。計算方法はAVG、MIN、MAX、ATTR(属性)などが選べる。
COUNTD、MEDIANは選べない。

③フィルター利用時
プライマリデータソースのフィールドでフィルターをした場合、プライマリデータソースのViz上にあるデータには全てフィルターをかけることは出来る。
しかし粒度になっていないセカンダリデータソースのフィールド(つまりViz上でも、カードでも、ページでも使われていないフィールド)にはフィルターをかけることはできない。

解決法①
プライマリデータソース側で設定した同じフィールドを、セカンダリデータソース側でも設定する。ブレンディングに慣れていない間はこっちのほうが良い。

解決法②
手動で鎖をつなぐ。同じデータを別のワークシートでも分析を行う時もいちいち手動で設定しないといけないので少し大変。
しかしフィルター設定は一つで済む。

フィルターに置いたフィールドの下向き▼から適用先ワークシート → 関連するデータソースを使用する全て を設定してもセカンダリデータソースのディメンションにフィルターはかからない。
関連するデータソースを使用する全ては、
「このディメンションと共通の切り口(ブレンドリレーションシップの設定されたディメンション)を持つ他のデータソースを、他のワークシートでプライマリデータソースとして使った場合、そのワークシートでも同様のフィルターをかける」という設定だから。

tableauはデータを結合方法がたくさんあります。データの持ち方もたくさんあります。
私自身が結合とブレンディングの違いでめちゃくちゃ悩んだので、今回のブログもとても参考になりました。
tableauプロフェッショナルの方の記事は本当に助けられています。
勉強頑張って、DATASaber最終試験絶対受かりたいです!!

本日は以上です。
最後まで読んでいただきありがとうございます。

この記事が気に入ったらサポートをしてみませんか?