見出し画像

Tableau 8つのハードルを越える①’(ダッシュ)「メジャーとディメンションを使ってTableauは何をしているのか?マークとは何か?」

*この記事は2022年11月に追加したものです。

こんにちは。
前の記事(下記)では、「Tableau 8つのハードルを越える」一つ目の記事として、ディメンションとメジャーについて解説させて頂きました。

ここで、次のハードルに進む前に、「そもそもTableauって何をしているのか?」考えてみたいと思います。

早速、サンプルスーパーストアデータを使ってVizを作っていきましょう。
(この記事では、Tableau Version 2019.1のデータを利用しています。)

まず、Tableauから、サンプルスーパーストアExcelの注文シートに接続し、
売上を行シェルフに持っていきました。データ全体の売上が縦棒グラフになりました。

棒グラフにマウスをあてると、データ全体の売上合計が、227,176,842と分かります。

この売上合計は、データ全体を全てひとくくりにして集計した結果となっています。この状況をイメージ図にしてみます。
まず、下図のように、データ全体の中の1行1行のレコードを点で表し、
データ全体を点の集まりで表現してみました。

このデータ全体を下図のように、ぐるっと囲ってひとまとまりにして、
合計(売上)を集計しています。

次に、この棒グラフを地域別にしてみたいと思います。
地域を列シェルフに持っていきました。

すると上図のように、棒グラフが地域毎に分かれ、8本になりました。
この時、Tableauは、どのようにデータを切り分け集計しているか?
また、イメージしてみたいと思います。

今回は下図のように、データを地域ごとの8つの部分に切り分け

それぞれの、部分の中で合計(売上)を求める集計を行っています。

続いてさらに、カテゴリをマークの色に持っていき、カテゴリで色分けしました。下図になります。

この時、データを切り分けて集計しているイメージはどうなるでしょうか?

下図のように、さらにカテゴリでも切り分ける事になり
地域8つ × カテゴリ3種類 
の24か所の部分に切り分けられています。

そして、それぞれの部分の中で集計が行われています。

この24か所の部分に分かれたデータが集計されて、それぞれ棒の形になり、それらの棒をカテゴリ毎の棒は積み重ねることで、上記のようにカテゴリ毎に色分けされた8本の棒グラフになったわけです。

では、次に本記事のタイトルにも登場している「マーク」とは何か?
考えてみます。

一番最初、全部の売り上げを棒グラフにしましたが

ここで、普段は目を運ばない、また、今後もあまり目を運ぶ機会は多くない、Tableauの画面の左下を見てみましょう。
下図のように、「1個のマーク」と表示されています。

続いて、地域毎(下図)にした時には


画面、左下には「8個のマーク」と表示されています。
なんとなく、予想がついてきていると思いますが、最後

こちらのVizになった際には、24か所の部分で集計が行われているとご説明しましたが、左下のマークも

このように、「24個のマーク」と表示されています。
この「24個のマーク」という表示はVizを変化させたとき、例えば
下図のように、カテゴリを列に持っていって24本の棒グラフにしたり、

色分けを地域にしてみたり、

さらに、棒フラフでなく「円」でプロットしてみたり、

さらには、下図のように地域毎の地図表現に変えてみても、

ずっと

「24個のマーク」のままです。
データの視覚化の方法はどんどん変わっていきましたが、
「データを24か所の部分に分けて、それぞれの部分で集計し、集計結果を表示させる」という点は、変わらず共通でした。なので、マークは24個のままなのです。

これらを踏まえて、マークとは何か?を言葉で表現すると
「Tableauが、データを様々な切り口で切り分け、集計結果を何らかの形に視覚化したものの総称」
と表現するとしっくりくると思います。
そしてマークの数とは、すなわち、Tableauがデータを切り分け集計計算を行った部分の数と同じです。
(補足:データの存在しない部分は集計は行われずマークとしては数えられません。)

そう考えると、Tableauの画面の

この「マーク」という部分。
これは、
・マークのもととなるデータの部分を、どのような切り口で作っていくか
・その部分で集計した結果を、マークとしてどのように表示させるか
を指定する部分と解釈すると、この部分のタイトルが「マーク」となっている事も、しっくりくるかもしれません。

なお、この「マーク」欄以外にも
列や、行、ページもデータを切り分ける切り口を決めることに使われます。

これらの赤くなっている部分に、前記事で解説した「ディメンション」を置くと、データを分ける切り口が決まっていきます。

*補足:赤点線の部分にディメンションをドラッグ&ドロップした場合は、必ず他の赤枠実線部分のどこかに当該ディメンションが入ります。

そして、そのデータが切り分けられた部分の中で、メジャーを集計し視覚化表示をする。
これがTableauの行っている事の基本になります。

本記事冒頭で作成した3つのVizで振り返ると

・最初、1本の棒グラフでデータ全体の売上を集計
  → この時のデータの切り分け「なし」

・地域毎の棒グラフに変更 
   → この時のデータの切り分け「地域」

・さらにカテゴリ毎で色分け 
  → この時のデータ切り分け「地域 と カテゴリ」

ここから例えば、顧客名、製品IDなどのディメンションでデータを細かく切り分け集計していくと、集計する部分の大きさはどんどん小さく、つまり細かくなっていきます。

Tableauでは、ドラッグ&ドラッグ操作でディメンションを列や行・マークの色・詳細などなどに置く事で、直観的にデータを切り分ける切り口を次々に変化させる事ができます。そして、集計結果が視覚化されます。

この連続した操作が、データと会話しているように視覚化をする手助けをしてくれており、この感覚がTableauの魅力と一つと言えると思います。

なお、何度も出てきている「データを切り分ける部分の細かさ」を
粒度(LOD)」と言ったりしますが、まだ、この言葉を気にして頂く必要はありません。

まずは、思うがままに、ドラッグ&ドロップして、データが様々に切り分けられ集計される事を体感してみてください!

ご精読ありがとうございます。

次の記事「連続と不連続 その1」は下記になります。

*連載記事すべてへのリンクは、こちらのマガジンにまとめています。

By ritz_Tableau
Tableau Zen Master | Tableau Public Ambassador |
Tableau Certified Professional | Data Saber
Twitter : @ritz_Tableau
Tableau Public : https://public.tableau.com/profile/satoshi.ganeko#!/
*記事の中に不正確な点などありましたら、是非、Twitter Direct Mailでお知らせ下さい。よろしくお願いします。m(__)m

おことわり

当記事のコンテンツについて、商用利用でない場合は許可なく転載して頂いて構いません。(ハードル画像および他のサイトから引用している画像は除く)
転載の際は、当記事へのリンクを掲載し転載であることを明記してください。商用利用の場合は許可なく転載しないで下さい。
当記事のコンテンツについて、可能な限り正確な情報を掲載するよう努めていますが、誤情報が含まれたり、情報が古くなっている可能性があります。当記事に掲載された内容、および、当記事からリンクやバナーによって移動したサイトに掲載された内容によって生じた、損害等の一切の責任を負いかねますのでご了承ください。よろしくお願いします。



この記事が気に入ったらサポートをしてみませんか?