Tableau DATA Saberチャレンジ日記②
語彙力ゼロのダメリーマンによるDATA Saberチャレンジ日記の第二回は
一つ目の試練「1.HandsOn - Fundamental」についての振り返り(備忘録)です。
Q1.サブカテゴリ「バインダー」は「事務⽤品」内で売上第何位?
グラフの横軸の項目名の上にある並べ替えアイコンをクリックすると売上の昇順で並べ替え可能。
ツールバーのTボタンを押すとグラフに値(マークラベル)を表示できるが、これだけだと順位がわかりづらいので、以下の方法で順位表示が可能。
①Ctrlキーを押しながら売上をドラッグアンドドロップ(以降D&Dと略す)②コピーした売上を右クリック→簡易表計算→ランクを選択
③売上をマークカードのラベルに左クリックでD&D
④計算方法をペイン(横)に変更
Q2.割引率が最も⼤きい地域は︖ また、そこでの割引率は何%?
割引率の集計方法を平均に変更して、昇順で並び替えする。
ラベルを表示するとわかりやすい。
Q3.オーダー⽇が2014年の顧客IDとカテゴリの組合せの種類数は?
行にカテゴリと顧客IDをD&Dし、オーダ日をフィルターシェルフにD&Dして2014を選択する。
画面左下にマーク数が表示されているのでこの数が答え。
もしくは、カテゴリを右クリックして作成→計算フィールドを選択し、
「カテゴリ+顧客ID」という計算式を入力すると二つを組み合わせたフィールドが作成できる。これを行にもっていって集計方法をカウント(個別)に変更すると組み合わせの数がわかる。
Q4.売上トップ10のオーダーIDを教えてください
オーダIDを行に売上高を列にもっていくと横向き棒グラフになる。
オーダIDをコピーしてフィルターシェルフにD&Dして売上のフィールドで上位10位を選択する。
Q5.年⽉ごと売上の前年⽐成⻑率を確認し、2016年の成⻑率が年の後半に向かってより⾼く上がる傾向にあるカテゴリはどれ?
傾向は線形で確認してください。
売上を右クリックして簡易表計算の前年比成長率を選択。
グラフ右下に表示されている〇個のNULLという表示はフィルターで非表示にしておく。
アナリティクスペインで傾向線をD&Dすると事務用品が年の後半に向かって高く上がる傾向が確認できる。
Q6.製品マスタ不備でカテゴリ項⽬に誤りがあることが判明。製品IDの先頭の「-」より前を区切って正しいカテゴリを取得し、製品IDからカテゴリごとの正しい売上を算出してください。
データペインの製品IDを右クリック→変換→カスタム分割を選択。
区切り文字でハイフンを入力し、分割は最初の1列目を選択する。
Q7.Excelと同じレイアウトでグラフを作って欲しいと頼まれた。 サブカテゴリごとに、売上と利益に加え、数量も同時に⾒せてくれますか︖(以下の図と同じグラフを作成してください)
売上のグラフの軸部分に利益をD&Dするとメジャーバリューとして一つの
項目にまとめられ、一つのグラフになる。
列にメジャーバリューが追加されているので、メジャーバリューのマーク
カードの色にD&Dし、グラフの形状を線に変更する。
数量を左側においてメジャーバリューを右クリック→二重軸を選択する。
Q8:顧客区分ごとに、地域別の売上実績を教えてください。
・売上は地域ごとの⽐較がしやすいようにすること
・同時に数値も表⽰すること
・売上は桁数が多いため視覚効果を圧迫しないよう⼯夫すること
・地域は上から順に、北から並ぶようにすること
視覚効果を圧迫しないよう売上の書式設定で「数値(カスタム)」にして
小数点を0、表示単位を百万に変更する。
Q9.家具と家電の累計数量に差が開き始めるのは何年何⽉から?
オーダー日を右クリックで列にD&Dして緑(連続)の月を選択する。
数量を行に追加して右クリック→簡易表計算→累計カウントを選択する。
カテゴリをマークカードの色にD&Dし、フィルタで事務用品を除外する。
Ctrlキーを押しながら数量をD&Dしてコピーし、表計算の編集→セカンダリ計算→次との差→特定のディメンション→カテゴリを選択する。
グラフを棒グラフに変更し、色になっているカテゴリを詳細にD&Dする。
数量を色にD&D、線グラフの色と被らないようにほかの色に変更する。
(マイナス値なので反転にチェックを入れる)
Q10.サブカテゴリごとの売上と顧客数の間に関連性はあるか?
売上を行に、顧客IDを右クリックしてD&D→個別カウントを選択する。
サブカテゴリをマークカードのラベルにD&Dする。
散布図ができるので、アナリティクスペインの傾向線をD&Dする。
真横の線になるので相関がないことがわかる。
Q11.4年間で購⼊顧客数が最も多い曜⽇は︖ また、その⼈数は?
列にオーダー日を右クリックでD&Dして曜日を選択する。
行に顧客IDを右クリックでD&Dして個別のカウントを選択する。
最大値のみラベルを表示する。
Q12.オーダー⽇の全ての曜⽇で利益率が15%を切っている年は?
行にオーダー日を右クリックでD&Dし、青(不連続)の年を選択する。
行にオーダー日を右クリックでD&D→曜日を選択する。
データペインの利益を右クリックして作成→計算フィールドを選択し、
計算式は「SUM([利益])\SUM(売上)」と入力し利益率フィールドを作成する。
アナリティクスペインで定数線→0.15を入力すると、2016年のすべての曜日で15%を切っていることがわかる。
Q13.サブカテゴリ・顧客区分の組み合わせで、割引率が相対的に⾼いと分類される組み合わせをグループでまとめてください。
(それ以外は「その他」とします)
作成したグループごとに売上の伸びと利益率を年⽉の推移で⽐較して、 割引率を上げるべきか下げるべきか教えてください。
列にサブカテゴリ、行に顧客区分、マークカードの色に割引率をD&Dし、
色の編集で2ステップカラーに変更する。
テーブルのすべての顧客区分&画材の小規模事業所の割引率が高いことが
わかるので、4つの項目をグラフ上でCtrlキーを押しながら選択し、要素の
グループ化(クリップみたいなアイコン)→すべてのディメンションを選択
割引率が高いものと、その他に分類される。
新しいシートの行に↑で作成したグループ、売上、利益をD&Dする。
列にオーダー日を右クリックでD&Dし、緑(連続)の月を選択する。
利益のグラフを棒線に変更して二重軸にする。
グラフの縦幅が短いので軸の範囲で独立した範囲に変更する。
アナリティクスペインで売上に傾向線を表示する。
割引率が高いグループは売上高と利益率に相関がないことがわかる。
従って割引率は下げたほう良い。
Q14:2013年で⼀番売上が低い⽉と2015年で⼀番売上が⾼い⽉
だけの平均⾦額は、全⽉の平均⾦額よりも⾼いですか︖
列にオーダー日を右クリックでD&D→青(不連続)の年と月を表示する。
行に売上高をD&Dし、アナリティクスペインでリファレンスライン
→テーブルを選択すると、デフォルトで平均線が表示される。
グラフ上で2013年の2月と2015年の5月をCtrlキーを押しながら選択すると
その二点の平均線が表示されるので、全月の平均線より上になっていることがわかる。
Q15:Q14で作成したチャートで年⽉の売上のトレンドを⾒ることができるようになりました。さらにブレイクダウンして、各年や⽉で何(カテゴリ、サブカテゴリ)が誰(顧客区分)に売れたのかをクロス集計表で確認したいです。
2枚のシートを組み合わせてチャートをクリックするとフィルターされるダッシュボ ードを作りたいのですが、⼀つのマークをクリックしたときに⽉でフィルターするだけでなく年でフィルターするオプションを選ばせることはできますか︖
カテゴリ、サブカテゴリ、顧客区分を行に、年(オーダ日)を行に、売上をテキストにD&Dしてクロス集計表を作成する。
ダッシュボードにQ14のシートとクロス集計表シートを配置する。
Q14シートの右側に表示されているフィルタとして使用をクリックすると、
グラフの月をクリックするとクロス集計表のフィルターが可能となる。
ツールバーのダッシュボード→アクション→アクションの追加→フィルタの追加→アクションの実行対象→メニューを選択する。
フィルターの項目で選択したフィールドを選択→ソースフィールドで
「年(オーダー日)」を選択→適切な名前に編集する。
名前の横の挿入をクリックすると選択したフィールド名を名前として表示できるので、ここでは「<YEAR(オーダー日)>年のフィルタ」としておく。
同様にもともとあるフィルターを編集してアクションの実行をメニューに
変更し、名前を「<YEAR(オーダー日)>年<MONTH(オーダー日)>月のフィルタ」としておく。これでグラフで選択したときのメニューに二つのフィルタが表示されるようになる。
Q16 「家具」カテゴリにおいて⼀番出荷までの平均⽇数が⻑い地域に⾯する地域の中で、最も出荷までに時間がかかる 地域を調べてください。 その地域の「事務⽤品」カテゴリでの出荷にかかる⽇数は何⽇ですか︖
出荷までの日数はDATEDIFF関数で計算する。
都道府県に対して地理的役割→都道府県/州を選択し、その上位の項目である地域に対して地理的役割→都道府県を選択する。
地図表示にしてマークカードの色に出荷までの日数の平均をD&Dする。
列にカテゴリをD&Dしてフィルタで家電を外す。
一番平均日数が長いのは東北地方ということがわかる。
その東北地方に面する地域の中で事務用品の出荷までにかかる日数が一番長いのは中部地方の4.0173日となる。
Q17.売上と利益の相関を、製品名とカテゴリごとの分布で⾒てください。クラスター分析を使⽤して売上が⾼いグループがどこまでか割り出したとき、売上の⾼いと思われるクラスターに属する製品名が少ないように⾒えるカテゴリを教えてください。
厳密な個数を⽐較する必要はなく、⽬視で確認できるレベルで構いません。なお、クラスター数は⾃動のまま変更する必要はありません。
Ctrlキーを押しながらデータペインの売上、利益、製品名を選択して、画面右側の表示形式から散布図を選択する。
アナリティクスペインからクラスターを標準で選択。
売上が高いクラスターの色を強調、低いほうをグレーアウトしてマークを
円に変更する。
カテゴリを詳細にD&Dして右クリック→ハイライターを表示する。
ハイライトにより事務用品が少ないことがわかる。
大した事書けてないのにめちゃくちゃ時間かかった・・・。
この記事が気に入ったらサポートをしてみませんか?