Tableau DATA Saberチャレンジ日記⑩

語彙力ゼロのダメリーマンによるDATA Saberチャレンジ日記の第十回は
九つ目の試練「9.HandsOn - Advanced Ⅱ」の振り返り(備忘録)です。


Q1.サブカテゴリ「テーブル」の最後の年(2016)の売上は、最初の年(2013)と⽐べて何%増加していますか︖

サブカテゴリのテーブルの売上の線グラフを作成。
売上を右クリックして表計算の編集で「次との差の割合」を選択し、特定のディメンションでオーダー日の年を選択、基準の「最初」に選択する。


Q2. 各都道府県がサブカテゴリ「椅⼦」の利益に及ぼした貢献度を知りたいです。都道府県を利益合計を多い順に並べ、積みあがっていく状況と総計を表してください。
Q2-1:累計利益⾦額が最⼤となるのはどの都道府県ですか︖
Q2-2:Q2-1の時の利益はいくらでしょうか︖
Q2-3:利益に対して貢献できなかった都道府県に地域特性はありますか︖

都道府県別の利益のグラフを作成し、簡易表計算の累計カウントにする。
次を使用して計算で都道府県を選択。アナリティクスペインで総計を表示。
グラフの種別をガントチャートに変更し、アドホック計算でマイナス利益を追加し、サイズに入れる。地域を属性にして色にD&Dする。

【ポイント】
 ガントチャートのサイズにプラスの利益を入れると線の上に棒が重なる
 のでマイナスにする必要がある。
 地域をそのまま色に入れるとディメンションとして区切られてしまう
 ので属性にする。


Q3. 年四半期ごとサブカテゴリの売上ランキングの推移をみたとき、Q3-1:最も⻑い間、継続して1位を獲得していたのはどのサブカテゴリでしょうか︖
Q3-2:そのサブカテゴリがもっともランキングを下げたときは何位でしたか︖
Q3-3:そのサブカテゴリ含め、同じカテゴリに所属しているサブカテゴリは全期間の内何回1位を獲得しましたか︖

四半期ごとの売上の線グラフを作成し、サブカテゴリで色分けする。
線の重なりをほどくために売上を簡易表計算のランクに変更し、サブカテゴリでの計算に変更する。並び順が逆なので軸の編集で反転にチェックする。
売上のランクとオーダー日を不連続に変更してクロス集計表を作成する。
列にMIN(1)という計算式を入れ、軸の最大値を1に変更し、ヘッダを非表示にする。サブカテゴリをラベルに入れるとハイライト表が完成する。
カテゴリを属性にして色に入れるとカテゴリの回数が数えられる。

【ポイント】
ランク計算の場合は降順になるので軸を反転させること。


Q4. 利益TOP10、WORST10の顧客の売上を⽐較し、利益でTOP1の⾦額を出している顧客の売上とそれ以外の顧客それぞれの売上の差を⾒せてください。
Q4-1:利益TOP1の顧客より⾼い売上を出している顧客はいますか︖
Q4-2:利益WORST10の顧客の中で売上⾦額の差が利益TOP1と⽐較してもっとも⼩さい顧客との⾦額差はいくらですか︖
Q4-3:Q4-2の顧客は利益WORST何位でしたか︖

利益TOP10とWORST10のセットを作成し、結合セットを作成してフィルタにもっていく。売上のグラフを作成し、行にTOP10のセットを置いてヘッダにする。売上を複製して簡易表計算→次との差→表(下)→基準を最初に変更すると一位との差異が表示できる。
利益のランクを作成→ペイン(下)→不連続に変更してヘッダにする

【ポイント】
 ワースト10を確認するときは逆順となるので要注意。
 ランクをコピペして昇順計算に変更したものを用意するとわかりやすい。


Q5. 年四半期の売上が最⾼記録を更新したのは何回ありますか︖売上が最初に発⽣した四半期は回数から除いて下さい。
なお、最⾼記録を更新したタイミングがわかるよう、その箇所は⾊を変えて表現してください

オーダー日(四半期)の売上の線グラフを作成し、簡易表計算の累計カウントで計算タイプを最大値にすると累計売上の最大値のグラフができる。
売上を複製して形状を円に変更し、二重軸に変更して軸の同期にチェック。
円の方のアドホック計算で売上の累計カウントをD&Dし、以下の計算式を
作成して色に入れる。

 INDEX()>1 and RUNNING_MAX(SUM([売上]))=sum([売上])

【ポイント】
INDEX()>1で初回の売上発生の四半期を除外できる。


Q6. 利益率ワースト3のサブカテゴリを除外すると、利益率は何%になりますか︖

パターン①:LOD計算&フィルタアクション
利益率の横棒グラフを作成、利益率を複製し{}をつけてLOD計算にする。
共有軸にしてメジャーネームをサイズへD&Dし、メジャーネームを複製して色にD&Dする。ツールバーの分析のスタックマークをオフにすると重なった棒グラフを作成できる。色の不透明度を下げ、ラベルの位置を下付けにしておく。
サブカテゴリ別の利益率のグラフを作成し、ダッシュボードでフィルタとして使用し、フィルターの編集で除外にチェックを入れるとダッシュボードで選択されたサブカテゴリが除外されたグラフが表示されるようになる。

パターン②:セットアクション
利益率の横棒グラフを作成し、適当にサブカテゴリのセットを作成し、そのセットを色にもっていく。色の凡例でINを非表示にする。
利益率を列に追加して二重軸にして軸の同期にチェックし、後から追加した利益率の色からセットを外す。
元々の利益率のサイズを小さくし、OUTの色を変更する。後から追加した方の利益率の色の透過率を下げる。
ダッシュボードのアクションの追加で、セット値の変更を選択し、ソースシートでサブカテゴリ別のグラフのシートを選択、ターゲットセットで適当に作ったセットを選択する。
アクションの実行結果でセットに値を割り当て、選択項目をクリアした結果ですべての値をセットから削除にチェックを入れると同様の動きになる。

【ポイント】
フィルターアクションで対象シートのフィルターを編集し、除外にチェックを入れると選択した項目を除外できるようになる。
セットアクションでも同様のことができる。INを非表示することでOUTのみ表示されるため、値をセットに割り当てすると非選択項目のみ表示、セットから削除すると全表示という動きになる。


Q7. サブカテゴリごとの売上と売上の前年⽐成⻑率の相関を年ごとに確認したいです。2015年と2016年で前年⽐割れしてしまったサブカテゴリの傾向を教えてください。
役員がモバイルで確認するため横に並べて各年を⽐較することができず、フィルターで切り替えて確認できるように依頼されています。

年度、売上、売上の前年比成長率(簡易表計算)で散布図を作成する。
サブカテゴリをラベルに、前年比成長率を色に入れる。
年度をフィルタに入れても何も表示されないので、以下の計算式を作成して、不連続に変更してフィルタにもっていく。
LOOKUP(MIN(DATEPART('year',[オーダー日])),0)

【ポイント】
オーダー日のディメンションフィルターの場合は年度でフィルターした後に前年比成長率が計算されるので表示できなくなるが、ダイナミックハイドを使うことで前年比成長率を計算した後で年度フィルターできるようになる。

ダイナミックハイド=クエリパイプラインの最後に適用される表計算フィルターを使った表現。LOOKUP関数のオフセットを0にすると計算式の値をそのまま表示できるので、これをフィルターとして使うと前年比成長率を計算した後に年度のフィルターが適用される。
※アドホック計算はフィルターに持っていけないので注意

モバイルのレイアウトではスマホでの操作を想定して、フィルター等の操作ボタンは下に配置する方がよい。


Q8 出荷にかかる平均⽇数を週単位の推移で⾒せてください。社の⽅針として上⽅管理限界線(UCL︓UpperControlLimit)を3σとして管理しているのですが、
Q8-1:この限界を突破して配送が遅延した週は何回ありましたか︖
Q8-2:その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。

出荷までにかかる日数をDATEDIFF関数で算出し、週ごとの日数を線グラフで表示する。分布バンドの計算を標準偏差に変更し係数を-3、3で設定する。
出荷までにかかる日数を複製し、形状を円に変更。二重軸にして軸の同期にチェックを入れる。
アドホック計算で上⽅管理限界線(UCL︓UpperControlLimit)が3σを超えた場合の色の条件式を入力
AVG([出荷までにかかる日数])>WINDOW_AVG(AVG([出荷までにかかる日数]))+WINDOW_STDEV(AVG([出荷までにかかる日数]))*3

市区町村別、地域別の出荷までにかかる日数の平均の棒グラフを作成し、
ダッシュボードのフィルタでQ8-1のグラフと連携させる。

【ポイント】
分布バンドで標準偏差を表示可能。
WINDOW_STDEV関数でグラフの標準偏差を返す(*3で3σ)


Q9 2016年の四半期単位の売上推移をメーカーごとに⽐較してください。メーカー名が「s」で終わるメーカーにはどのようなトレンドがありますか︖メメーカーの情報はExcelに⼊っていないので、「サンプル-スーパーストア-メーカー情報.tdsx」を使⽤してください。

メーカー情報はブレンドで抽出。
メーカーのフィルタでワイルドカードの後方一致でS終わりを抽出。
※プライマリグループで作成したメーカーではワイルドカードを設定できず

各メーカーごとの四半期の売上の線グラフを作成。
金額規模がバラバラなので、軸の範囲を独立に設定。

終点の場合のみ値を表示する計算式を作成し、二重軸にして軸の同期にチェックを入れ、形状を円にする。ラベルは最大値のみ表示する。
IF LAST()=0 then SUM([売上]) END

トレンドだけ分かればいいのでヘッダは非表示にする。

【ポイント】
軸の範囲を独立に設定し、軸を非表示にしてトレンドを掴むために小さな折れ線グラフを複数並べたチャートをスパークラインチャートという。


Q10 地域別売上ランキングの推移を年四半期で⾒たとき、売上開始当初(2013/1Q)と最終四半期(2016/4Q)でランキングの変動があった地域はどこですか︖

売上の年四半期の推移のグラフを作成し、地域を色にD&Dする。
売上は簡易表計算のランク→地域で計算に設定し、軸を反転する。
始点と終点以外を全選択して除外する。
もしくは以下の計算式をフィルターにもっていき、真にチェックを入れると表の始点と終点のみ表示させることができる。
FIRST()=0 or last()=0


Q11 カテゴリ「家電」における週数別の売上を⾒たとき、500,000円を連続で超えたのはQ11-1:最⼤何週間ですか︖
※閾値500,000はシミュレーションで変更される可能性があるので可変にしてください。閾値を超えた週を異なる⾊で強調した上で「閾値超え連続週数」を数えて下さい。
閾値超えが途切れたら、ゼロリセットし、閾値超え連続週数の値を連続した週の最後の週にのみ表⽰して下さい。
Q11-2:連続で超えている間、500,000円の超過分を累計したとき、最も⾼い累計⾦額はいくらですか︖※閾値を超過している分の売上⾼を累計し、最後の週に表⽰してください。

整数のパラメータを最小値500,000で作成する。
閾値判定の計算式を作成する。SUM([売上])>[閾値]

週別の売上の棒グラフを作成し、リファレンスラインの値で作成した閾値のパラメータを選択し、アドホック計算で閾値を超えた場合の計算式を作成し、色にD&Dする。

PREVIOUS_VALUE関数で閾値超え連続週数の計算式を作成する。
IF [閾値判定] then PREVIOUS_VALUE(0)+1 else0 end

連続が途絶えた場合にラベルを表示させないように以下の計算式をラベルにする。
IF lookup([超過週累計],1)=0 and [超過週累計]>0 then [超過週累計] end

500,000円の超過分を累計したときの最大累計⾦額は以下の計算式で作成。
(閾値をマイナスするのがポイント)
IF [閾値判定] then PREVIOUS_VALUE(0)+(sum([売上])-[閾値]) else 0 end

【ポイント】
PREVIOUS_VALUE関数は表計算を行う際に、最初の行は指定された値を基に計算を行い、2行目以降は1行前の値を基に計算を行う。
IF [閾値判定] then PREVIOUS_VALUE(0)+1 else0 end
↑の計算式では閾値を超えている場合は0に1を足す、二回目以降は1に1を
足す、0の場合は終了する。

IF lookup([超過週累計],1)=0 and [超過週累計]>0 then [超過週累計] end
↑の計算式は超過数累計の次の値が0かつ超過数累計が0より大きい場合に超過週累計を表示する、つまり超過数累計の最大のときのみ値を表示する。



この記事が気に入ったらサポートをしてみませんか?