Tableau DATA Saberチャレンジ日記④

語彙力ゼロのダメリーマンによるDATA Saberチャレンジ日記の第四回は
三つ目の試練「3.HandsOn - Intermediate I」の振り返り(備忘録)です。


Q1.北海道を除き、⾚字の1都道府県を除けば劇的に利益が向上
する地域の担当マネージャーを教えてください。

データソースで注文テーブルと関係者テーブルを地域の項目で結合する。
都道府県をもとに地域に地理的役割を付与する。
地図を作成し、利益で色分けする。
緯度を複製して詳細の地域を都道府県にドリルダウンし、形状を円にする。
色の利益の計算式をSUM[利益]<0に変更する。
地域マネージャーを詳細に登録しておく。
地図を複製して都道府県の緯度は削除して地域のみにする。
新しいシートで地域別の利益のグラフを作成する。
ダッシュボードで三つのテーブルを登録し、フィルターアクションで都道府県別の地図をもとに除外フィルターを作成する。
中部地方が赤字の県を除くと利益が大幅に向上することが分かる。

【ポイント】
 地図は緯度をコピーして二重軸にすると重ねられる

 マークカードの色の計算式で条件を入れると真偽で色分けできる

 ダッシュボードの地図で選択した都道府県を除外するフィルタの作成方法
 ①フィルターアクションで地図の都道府県のフィールドを登録
 ②ターゲットシートでフィルターを編集
 ③リストから選択にチェック→除外にチェック→なしにチェック


Q2.メーカーごとの売上の分布を⾒たとき、利益が⾚字になっているメーカーの売上に特徴はありますか︖なお、メーカーごとに作っている商品のカテゴリが異なるので、カテゴリも分けられるよう考慮して表現してください。メーカーの情報はExcelに⼊っていないので、「サンプル-スーパーストア-メーカー情報.tdsx」を使⽤してください。

Tableau Publicの場合、tdsxファイルが開けないので、拡張子をzipにして中身のExcelファイルを取り出す必要がある。
tdsxファイルは別のデータソースとして扱われ結合できないので、ブレンドで紐づけを行う。
製品IDを同じ名称にすると鎖マークが出てくるので、それをクリックすると紐づけができる。
製品IDとメーカーを行にD&Dしてメーカーを右クリックしてプライマリグループの作成を行うと、プライマリデータソースの項目として追加できる。
売上を列に、カテゴリを行において、利益を色に、メーカーを詳細において形状を円にすると分布図が作成できる。
売上高2500Kあたりに集まっていることが確認できる。

【ポイント】
 別のデータソースを紐づけする場合はブレンドを使う。

 分布図(≠散布図)を作る場合は棒グラフを作ってから分けたい
 ディメンションを詳細に入れてから形状を円にすると良い。


Q3.1年前の売上を⽬標⾦額としたとき、2016年の売上が⽬標未達成だったカテゴリを教えてください。
【オプション問題】そのカテゴリは95%は達成していましたか︖

計算式で2015年度と2016年度の売上高のフィールドを作成する。
2015年度の売上高をマークカードの詳細にD&Dして、リファレンスラインのセルを選択し、2015年度売上高を選択する。
オプション問題は分布バンドのセルを選択し、対象を2015年度売上高としてパーセントに95を入力するとその値のラインを引ける。

【ポイント】
各年度の計算フィールドを作成する際、オーダ日(年)を行列セルフに入れて置き、計算フィールドにD&Dすると「DATEPART('year', [オーダー日])」という計算式を自動で入れてくれるので便利。
リファレンスラインは下を塗りつぶすと棒グラフみたいになるので、ブレットグラフとして活用する際は便利。


Q4.1⾏単位で記録されている1商品取引ごとの利益を⾒たとき、
最も⼤きな利益を出している商品取引のあるサブカテゴリはどれですか︖また、そのサブカテゴリの合計利益は他のサブカテゴリに⽐べ好調でしょうか︖
【オプション問題】
1.対象サブカテゴリの⾚字レコードを除外すると合計利益のサブカテゴリランクがどのくらい上がりますか︖
2.対象サブカテゴリで⾚字レコードを出しているのはどこのメーカーが多そうでしょうか︖

サブカテゴリを列に、利益を行に追加する。
合計(利益)を右クリックしてディメンションに変更する。
グラフの形状を円に変更し、サイズと透明度を調整する。
利益を行に追加し、棒グラフに変更する。
利益を複製、簡易表計算のランクに変更し、棒グラフのラベルにD&Dする。

オプション問題は計算式でブール値のフィールドを作成(サブカテゴリが電話機かつ利益が赤字)し、フィルターシェルフにD&Dする。
フィルターを表示して確認するとランクの変動がわかる。
メーカーをマークカードの詳細にD&Dするとツールヒントで確認可能。

【ポイント】
Tablaeuのメジャーはデフォルトで集計されるので、行単位(非集計)に
分解したい場合はディメンションに変更する必要がある。


Q5.売上トップ10/ワースト10製品の利益は良好でしょうか︖
もし⾚字の製品がある場合、もっとも⾚字の製品数が多いカテゴリはどれでしょうか︖

データペインの製品を右クリックして売上上位10位のセットを作成する。
セットを複製して同様に下位10位のセット作成する。
二つのセットを選択して右クリックして結合セットを作成する。
この場合、すべての要素で結合する。
製品名を行に、利益を列に、フィルターシェルフに結合セットをD&Dすると上位&下位10位のグラフが作成できる。
列に上位のセットをD&Dすると上位と下位のグラフを分けられる。
棒グラフの幅が小さすぎるので軸のオプションで独立した範囲に変更。
利益をコピーして簡易表計算のランク(次を使用して計算→製品名)に変更。ヘッダとして使用するため、ランクの利益を不連続に変更する。
不連続の利益を行にもっていき、製品名を詳細に持っていく。
カテゴリをマークカードの色にD&Dする。このままだとカテゴリごとのランクになってしまうので、ランク計算にカテゴリが使われないようにするためカテゴリをディメンションから属性に変更する。

属性にする前
属性にした後

【ポイント】
セットは二つ結合できる。
ランクを不連続に変更すると項目ヘッダとして使用できる。
属性は集計単位(LOD)として使いたくないが情報として入れたい場合などに使う。


Q6.利益の合計がプラス(0は含める)のサブカテゴリごとで売上を⽐較してください。

サブカテゴリ別の売上の棒グラフを作成し、データペインの利益を右クリックしてフィルターシェルフにD&Dして「合計」を選択し最小値を0にする。

【ポイント】
フィルターでも集計、非集計を切り替え可能。
この場合は集計のフィルター(サブカテゴリ別の売上の合計値が0以上)


Q7.利益がプラス(0は含める)のレコードだけで、サブカテゴリごとの売上を⽐較してください。

サブカテゴリ別の売上の棒グラフを作成し、データペインの利益を右クリックしてフィルターシェルフにD&Dして「すべての値」を選択し、最小値を0にする。

【ポイント】
フィルターでも集計、非集計を切り替え可能。
この場合は非集計のフィルター(売上が0以上のデータのみサブカテゴリ別に合計)


Q8.利益が⾚字顧客と⿊字顧客の売上の割合をオーダー⽉ごとに教えてください。(⽉別トレンドを⾒たいので、オーダー年は含めない。顧客の項⽬は顧客名を使⽤すること)
利益が赤字の顧客が最も多いのは?

利益が赤字のセットを作成し、オーダ月別の売上高の積み上げ棒グラフを作成する。売上高を簡易表計算の合計に対する割合(セット)に変更する。

【ポイント】
セットのINOUTの比率で積み上げ棒グラフを作成できる。
デフォルトで軸の最大値が105%になるので、見た目をよくするには最大値を固定値で1に変更すること。


Q9.2016年の売上を昨年の売上と⽐較します。昨年の売上はカテゴリごとに⾒る必要はありません。今年の売上はカテゴリごとに⾊分けしたいです。これと同時に今年のカテゴリごとの売上累計を表⽰したいです。バラバラにグラフを作ることはできたのですが、これを重ねて⼀個のグラフにすることはできるでしょうか?

Q3で作成した2015年売上と2016年売上のフィールドを使用する。
2015年売上をマークカードの詳細にD&Dしてセルのリファレンスラインをひく。2016年の売上の棒グラフを作成し、カテゴリ別に色分けする。
2016年の売上を複製して累計カウントの線グラフに変更し、二重軸にする。


Q10.売上と利益の相関を⾒たときに利益が低いクラスターと、売上と割引率の相関を⾒たときに割引率が⾼いクラスターの顧客をそれぞれ探してください。⼈数を絞りたいので、いずれもクラスター数は5に設定してください。
そのクラスターを⽤いて、割引率は⾼いけれども利益は低くない顧客を割り出し、割引率を⾼く設定しながらも⽐較的⿊字を出せている顧客区分を教えてください。

売上、利益、顧客名を使った散布図、売上、割引率、顧客名を使った散布図を作成し、それぞれにクラスターを5個で設定する。
利益が低いクラスターを選択してセットを作成し、同様に割引率が高いクラスターを選択してセットを作成する。
割引率が高いクラスターと利益率が低いクラスターのセットの結合セットを作成する。この時、割引率が高いクラスター(共有要素を除く)を選択。
割引率、利益、顧客名の散布図を作成し、結合セットでフィルターする。
顧客区分ごとにグラフを分け、利益で色分けする。

【ポイント】
クラスターからセットを作成できる。(ツールヒントで対象のクラスターのクラスター名をクリックするとそのクラスターを全選択できるので、セットのアイコンをクリックすると作成できる)

条件が「割引率は高い かつ 利益が低くない」なので、セットの結合条件は割引率が高いクラスター(利益が低くないの共有要素を除く)を選択。

散布図の形を棒グラフにするのも有効。

Q11.地域、カテゴリ別の予算のファイルを⼊⼿しました。地域、カテゴリ、オーダー年ごとの売り上げ実績と予算を対⽐して、家電カテゴリにおいて、すべての年で売り上げ⽬標を達成していない地域を教えてください。
また、その未達成度合いはどのくらいでしょうか。50%にも満たない年があるようであれば教えてください。
なお、予算シート作成担当者がうっかりしており、家電は昨年までの名称「テクノロジー」のままになってしまっています。
また⽬標年⽉を更新せずに⽬標⾦額だけ更新してしまったようです。予算のExcelの年⽉は+2年して⽐較してください。

予算ファイルを開いてデータインタープリターで2011年~2014年の予算テーブルを分割し、それぞれをユニオンで繋げる。
横持ちテーブルだとTablaeuでは扱いづらいので、2011~2014の年月の列を選択して右クリック→ピボットで縦持ちテーブルに変換する。
項目名を予算年月、予算値に変更しておく。
予算データの製品カテゴリーの項目名をカテゴリーに変更し、別名を編集で、テクノロジーを家電に変更する。
予算データのエリアの項目名を地域に変更する。
予算データの予算年月から計算フィールドを作成し、DATEADD関数で年度に2を加算し、項目名をオーダー日に変更する。
年度別、地域別、カテゴリ別の棒グラフを作成し、予算値をマークカードの詳細にD&Dしてリファレンスラインをセルごとにひく。
分布バンドで予算値の50%にラインを引く。
マークカードに計算フィールドを作成し、予算値>売上の計算式を入力し、色にD&Dする。
カテゴリのハイライトを表示し、予算達成度を確認する。

【ポイント】
元のExcelデータを加工せずともデータインタープリターを使えばTablaeuで使いやすい形式に変換してくれる。

Tablaeuでは扱いにくい横持ちデータも元のデータで加工せずともデータソース画面のピボットで縦持ちに変換可能。



この記事が気に入ったらサポートをしてみませんか?