Tableau DATA Saberチャレンジ日記②

語彙力ゼロのダメリーマンによるDATA Saberチャレンジ日記の第二回は
一つ目の試練「1.HandsOn - Fundamental」についての振り返り(備忘録)です。



Q1.サブカテゴリ「バインダー」は「事務⽤品」内で売上第何位?

グラフの横軸の項目名の上にある並べ替えアイコンをクリックすると売上の昇順で並べ替え可能。
ツールバーのTボタンを押すとグラフに値(マークラベル)を表示できるが、これだけだと順位がわかりづらいので、以下の方法で順位表示が可能。

①Ctrlキーを押しながら売上をドラッグアンドドロップ(以降D&Dと略す)②コピーした売上を右クリック→簡易表計算→ランクを選択
③売上をマークカードのラベルに左クリックでD&D
④計算方法をペイン(横)に変更

【ポイント】
簡易表計算の計算方法がデフォルトで「表(横)」になっているため、そのままだと表全体でのランクとなってしまう。計算方法を「ペイン(横)」にすることでサブカテゴリ内のランクに修正可能。


Q2.割引率が最も⼤きい地域は︖ また、そこでの割引率は何%?

割引率の集計方法を平均に変更して、昇順で並び替えする。
ラベルを表示するとわかりやすい。

【ポイント】
メジャーをビューにD&Dした際のデフォルトの集計方法は合計になっているため、種類に応じて適切な集計方法に変更する必要がある。
データペインの既定のプロパティを変更しておくと、デフォルトの集計方法が変更される。(書式等も変更可能)

マークカードのラベルでラベルをつけるマークの最小値/最大値を選択してオプションの最大値にのみチェックすると最大値のラベルのみ表示可能。

できるだけ手数が少ない操作を覚えること。


Q3.オーダー⽇が2014年の顧客IDとカテゴリの組合せの種類数は?

行にカテゴリと顧客IDをD&Dし、オーダ日をフィルターシェルフにD&Dして2014を選択する。
画面左下にマーク数が表示されているのでこの数が答え。

もしくは、カテゴリを右クリックして作成→計算フィールドを選択し、
「カテゴリ+顧客ID」という計算式を入力すると二つを組み合わせたフィールドが作成できる。これを行にもっていって集計方法をカウント(個別)に変更すると組み合わせの数がわかる。

【ポイント】
計算式で作った組み合わせたフィールドは「カウント(個別)」での集計が可能だが、「結合済みフィールドの作成」で作ったフィールドは「カウント(個別)」での集計が不可。

メジャーを右クリックでD&Dすると集計方法を選択可能(この操作のほうが手数が少ない)


Q4.売上トップ10のオーダーIDを教えてください

オーダIDを行に売上高を列にもっていくと横向き棒グラフになる。
オーダIDをコピーしてフィルターシェルフにD&Dして売上のフィールドで上位10位を選択する。

【ポイント】
フィルターの上位〇位は動的フィルター(再計算される)
データを複数選択して保持した場合は静的フィルター(選択項目として固定)
保持したリストからセットを作成して保持しておくことが可能。
 ※上位300位のようにデータが多い場合はフィルタで表示してから
  Ctrl+Aで全選択→保持→セットの作成でOK


Q5.年⽉ごと売上の前年⽐成⻑率を確認し、2016年の成⻑率が年の後半に向かってより⾼く上がる傾向にあるカテゴリはどれ?
傾向は線形で確認してください。

売上を右クリックして簡易表計算の前年比成長率を選択。
グラフ右下に表示されている〇個のNULLという表示はフィルターで非表示にしておく。
アナリティクスペインで傾向線をD&Dすると事務用品が年の後半に向かって高く上がる傾向が確認できる。

【ポイント】
画面右下のNULLのインジケーターが残っているとデータの正確性が疑われるので、放置せず必ず処理すること。スペースが必要な場合はインジケーターを非表示にするのもOK。
※フィルターで非表示にした場合は「特別→NULL以外」が選択されている


Q6.製品マスタ不備でカテゴリ項⽬に誤りがあることが判明。製品IDの先頭の「-」より前を区切って正しいカテゴリを取得し、製品IDからカテゴリごとの正しい売上を算出してください。

データペインの製品IDを右クリック→変換→カスタム分割を選択。
区切り文字でハイフンを入力し、分割は最初の1列目を選択する。

【ポイント】
カスタム分割の中身はSPLIT関数とTRIM関数の組合せなので、関数を使っても同じ結果になるが、計算式を書く手間が発生する。
なるべくTablaeuの標準GUIを使った方が良い。
手数の少ない方法を選択する癖をつけること。


Q7.Excelと同じレイアウトでグラフを作って欲しいと頼まれた。 サブカテゴリごとに、売上と利益に加え、数量も同時に⾒せてくれますか︖(以下の図と同じグラフを作成してください)

売上のグラフの軸部分に利益をD&Dするとメジャーバリューとして一つの
項目にまとめられ、一つのグラフになる。
列にメジャーバリューが追加されているので、メジャーバリューのマーク
カードの色にD&Dし、グラフの形状を線に変更する。
数量を左側においてメジャーバリューを右クリック→二重軸を選択する。

【ポイント】
三重軸は作成できないので、単位が同じ項目をメジャーバリューとしてまとめてから二重軸を作成する。


Q8:顧客区分ごとに、地域別の売上実績を教えてください。
・売上は地域ごとの⽐較がしやすいようにすること
・同時に数値も表⽰すること
・売上は桁数が多いため視覚効果を圧迫しないよう⼯夫すること
・地域は上から順に、北から並ぶようにすること

視覚効果を圧迫しないよう売上の書式設定で「数値(カスタム)」にして
小数点を0、表示単位を百万に変更する。

【ポイント】
書式設定で表示単位を変えるとツールヒントの表示も変わってしまうので、ツールヒントの中だけ表示単位を元の状態で保持したい場合は、アドホック計算を使用した項目を作ってツールヒントに入れる。
マークカードの下の余白でダブルクリックして計算フィールドを作成し、
売上をCtrl押しながらD&Dして、計算式を「SUM([売上])*1」とする。
(名前が重複しないようにするため)
ツールヒントで売上の値部分を↑の項目に置換する。

地域の並び替えは手動で並び替え(ソート用のテーブルを作ったりしない)

軸の幅が気になる場合は軸の編集で「各行または列の独立した範囲」に変更してもよい(※軸の範囲が項目ごとに変わるのでミスリードに注意)

アドホック計算→ツールヒントに反映

Q9.家具と家電の累計数量に差が開き始めるのは何年何⽉から?

オーダー日を右クリックで列にD&Dして緑(連続)の月を選択する。
数量を行に追加して右クリック→簡易表計算→累計カウントを選択する。
カテゴリをマークカードの色にD&Dし、フィルタで事務用品を除外する。
Ctrlキーを押しながら数量をD&Dしてコピーし、表計算の編集→セカンダリ計算→次との差→特定のディメンション→カテゴリを選択する。
グラフを棒グラフに変更し、色になっているカテゴリを詳細にD&Dする。
数量を色にD&D、線グラフの色と被らないようにほかの色に変更する。
(マイナス値なので反転にチェックを入れる)

【ポイント】
 累計カウントなど、特定の計算方法はセカンダリ計算を使用して追加の
 計算をすることが可能。

 上記の「色になっているカテゴリを詳細にD&Dする」部分は数量を色に
 D&Dすると色に設定されていたカテゴリが上書きされ消えてしまうので、
 カテゴリの項目を残しつつ数量の色を設定するためにカテゴリを詳細に
 置いておく必要がある。


Q10.サブカテゴリごとの売上と顧客数の間に関連性はあるか?

売上を行に、顧客IDを右クリックしてD&D→個別カウントを選択する。
サブカテゴリをマークカードのラベルにD&Dする。
散布図ができるので、アナリティクスペインの傾向線をD&Dする。
真横の線になるので相関がないことがわかる。

【ポイント】
散布図の場合、横軸が原因、縦軸が結果になるように作るのが良い。
項目名は個別のカウント等のまま放置せず伝わりやすい名前に変更すべき。

【余談】
カテゴリを列に追加して表示してみると、カテゴリ別には相関があるように見える。


Q11.4年間で購⼊顧客数が最も多い曜⽇は︖ また、その⼈数は?

列にオーダー日を右クリックでD&Dして曜日を選択する。
行に顧客IDを右クリックでD&Dして個別のカウントを選択する。
最大値のみラベルを表示する。


Q12.オーダー⽇の全ての曜⽇で利益率が15%を切っている年は?

行にオーダー日を右クリックでD&Dし、青(不連続)の年を選択する。
行にオーダー日を右クリックでD&D→曜日を選択する。
データペインの利益を右クリックして作成→計算フィールドを選択し、
計算式は「SUM([利益])\SUM(売上)」と入力し利益率フィールドを作成する。
アナリティクスペインで定数線→0.15を入力すると、2016年のすべての曜日で15%を切っていることがわかる。

【ポイント】
利益率の計算式は「[利益]/[売上]」ではダメな理由。
[利益]/[売上]とすると行レベル計算(非集計計算)となるため、行ごとに
利益率を計算した後に集計することになる(行ごとの利益率を計算してから曜日毎に合計する)から計算結果が不正になる。
SUM()をつけることで集計計算となり計算結果が正しくなる。
(曜日毎の利益の合計値÷曜日毎の売上の合計値)


Q13.サブカテゴリ・顧客区分の組み合わせで、割引率が相対的に⾼いと分類される組み合わせをグループでまとめてください。
(それ以外は「その他」とします)
作成したグループごとに売上の伸びと利益率を年⽉の推移で⽐較して、 割引率を上げるべきか下げるべきか教えてください。

列にサブカテゴリ、行に顧客区分、マークカードの色に割引率をD&Dし、
色の編集で2ステップカラーに変更する。
テーブルのすべての顧客区分&画材の小規模事業所の割引率が高いことが
わかるので、4つの項目をグラフ上でCtrlキーを押しながら選択し、要素の
グループ化(クリップみたいなアイコン)→すべてのディメンションを選択
割引率が高いものと、その他に分類される。

新しいシートの行に↑で作成したグループ、売上、利益をD&Dする。
列にオーダー日を右クリックでD&Dし、緑(連続)の月を選択する。
利益のグラフを棒線に変更して二重軸にする。
グラフの縦幅が短いので軸の範囲で独立した範囲に変更する。
アナリティクスペインで売上に傾向線を表示する。
割引率が高いグループは売上高と利益率に相関がないことがわかる。
従って割引率は下げたほう良い。

【ポイント】
相対比較をする場合はステップドカラーで2ステップの色で表現する。

グラフ上で選択した項目をグループ化できる。

二重軸は左側が下、右側が上になるので、線グラフが棒グラフに隠れてしまわないように、左側に利益、右側に売上という並びにしたほうがよい。


Q14:2013年で⼀番売上が低い⽉と2015年で⼀番売上が⾼い⽉
だけの平均⾦額は、全⽉の平均⾦額よりも⾼いですか︖

列にオーダー日を右クリックでD&D→青(不連続)の年と月を表示する。
行に売上高をD&Dし、アナリティクスペインでリファレンスライン
→テーブルを選択すると、デフォルトで平均線が表示される。
グラフ上で2013年の2月と2015年の5月をCtrlキーを押しながら選択すると
その二点の平均線が表示されるので、全月の平均線より上になっていることがわかる。

【ポイント】
グラフ上で選択するだけでリファレンスラインが表示されるので、素早く
分析するときに有効活用できる。

軸にカーソルをあわせて右クリック→リファレンスラインの編集を選択することでリファレンスラインの編集が可能。

リファレンスラインもツールヒントの表示設定を変えられる。


Q15:Q14で作成したチャートで年⽉の売上のトレンドを⾒ることができるようになりました。さらにブレイクダウンして、各年や⽉で何(カテゴリ、サブカテゴリ)が誰(顧客区分)に売れたのかをクロス集計表で確認したいです。
2枚のシートを組み合わせてチャートをクリックするとフィルターされるダッシュボ ードを作りたいのですが、⼀つのマークをクリックしたときに⽉でフィルターするだけでなく年でフィルターするオプションを選ばせることはできますか︖

カテゴリ、サブカテゴリ、顧客区分を行に、年(オーダ日)を行に、売上をテキストにD&Dしてクロス集計表を作成する。
ダッシュボードにQ14のシートとクロス集計表シートを配置する。
Q14シートの右側に表示されているフィルタとして使用をクリックすると、
グラフの月をクリックするとクロス集計表のフィルターが可能となる。

ツールバーのダッシュボード→アクション→アクションの追加→フィルタの追加→アクションの実行対象→メニューを選択する。
フィルターの項目で選択したフィールドを選択→ソースフィールドで
「年(オーダー日)」を選択→適切な名前に編集する。
名前の横の挿入をクリックすると選択したフィールド名を名前として表示できるので、ここでは「<YEAR(オーダー日)>年のフィルタ」としておく。
同様にもともとあるフィルターを編集してアクションの実行をメニューに
変更し、名前を「<YEAR(オーダー日)>年<MONTH(オーダー日)>月のフィルタ」としておく。これでグラフで選択したときのメニューに二つのフィルタが表示されるようになる。

【ポイント】
ダッシュボードのアクションの追加で実行対象をメニュー選択にすることでフィルターを複数候補から選択させることが可能。
どんな条件かわかるように必ずフィルター名称を適切に設定しておくこと。


Q16 「家具」カテゴリにおいて⼀番出荷までの平均⽇数が⻑い地域に⾯する地域の中で、最も出荷までに時間がかかる 地域を調べてください。 その地域の「事務⽤品」カテゴリでの出荷にかかる⽇数は何⽇ですか︖

出荷までの日数はDATEDIFF関数で計算する。
都道府県に対して地理的役割→都道府県/州を選択し、その上位の項目である地域に対して地理的役割→都道府県を選択する。
地図表示にしてマークカードの色に出荷までの日数の平均をD&Dする。
列にカテゴリをD&Dしてフィルタで家電を外す。
一番平均日数が長いのは東北地方ということがわかる。
その東北地方に面する地域の中で事務用品の出荷までにかかる日数が一番長いのは中部地方の4.0173日となる。

【ポイント】
地域に面する=空間に関する質問

地域と都道府県は階層構造にあるので、都道府県だけでなく上の階層の地域にも地理的役割を付与することができる(カスタムテリトリー)


Q17.売上と利益の相関を、製品名とカテゴリごとの分布で⾒てください。クラスター分析を使⽤して売上が⾼いグループがどこまでか割り出したとき、売上の⾼いと思われるクラスターに属する製品名が少ないように⾒えるカテゴリを教えてください。
厳密な個数を⽐較する必要はなく、⽬視で確認できるレベルで構いません。なお、クラスター数は⾃動のまま変更する必要はありません。

Ctrlキーを押しながらデータペインの売上、利益、製品名を選択して、画面右側の表示形式から散布図を選択する。
アナリティクスペインからクラスターを標準で選択。
売上が高いクラスターの色を強調、低いほうをグレーアウトしてマークを
円に変更する。
カテゴリを詳細にD&Dして右クリック→ハイライターを表示する。
ハイライトにより事務用品が少ないことがわかる。

【ポイント】
フィルターは選択したものしか表示できないが、ハイライターは選択外の
ものを残しつつ選択したものを強調表示できる。

クラスターをデータペインへD&Dすると、そのクラスターをグループとして保持できる。


大した事書けてないのにめちゃくちゃ時間かかった・・・。


この記事が気に入ったらサポートをしてみませんか?