Tableau DATA Saberチャレンジ日記⑥

語彙力ゼロのダメリーマンによるDATA Saberチャレンジ日記の第六回は
五つ目の試練「5.HandsOn - Intermediate II」の振り返り(備忘録)です。


Q1.サブカテゴリの売上を以下のように分類し、それぞれのサブカテゴリがどこに属するかわかりやすいように表現してください。
また、サブカテゴリはカテゴリごとにまとめておいてください。
分類:2000万円以上、1000万円以上、500万円以上、500万円未満

売上高分類のための以下の計算式を作成し、カテゴリ、サブカテゴリ別の棒グラフの色に設定する。

IIF(sum([売上])>=20000000,"2000万円以上",
IIF(sum([売上])>=10000000,"1000万円以上",
IIF(sum([売上])>=5000000,"500万円以上",
"500万円未満")))

【ポイント】
売上高分類はサブカテゴリ別の売上高の合計値で条件を分岐する必要があるため、売上高はSUMをつけて集計計算とする。

売上高分類の計算式の結果は文字列になるが分類はメジャーとなる。
(計算フィールドに集計関数が入っていると集計値扱いとなる)


Q2.売上と利益に関するダッシュボードを作りたいのですが、スペースが狭すぎて⾒づらくなってしまいました。 売上と利益を同時に⾒る必要はなく、 ボタンを押して切り替えるようなレイアウトにすることはできませんか︖
なお、本設問ではVizの形や配置を変える必要はありません。

データペインで右クリック→パラメータの作成→売上と利益の選択肢を作成
データ型は整数のリストで値を1、2、表示名を売上、利益にする。
新たに計算フィールドを作成し、パラメータをD&Dして、条件を入力する。

パラメータの値が1の場合は売上を返し、そうでない場合は利益を返す。
IIF([パラメーター].[売上と利益切替]=1,[売上],[利益])

この計算式を使ってグラフを作成する。

【ポイント】
パラメータとはデータとは関連性のない関数の箱。

グラフの軸の編集で、軸のタイトルを値を使用に変更し、パラメータを選択することで軸の名前表示も切替可能。


Q3.1⾏単位の利益⾦額1万円ごとに区切ったとき、どの価格帯のオーダーが最も多いでしょうか。なお、区切る⾦額は⾒る部⾨によって違うことがあるようなので5千円ごとに5千~2万円で変更できるようにして下さい。

データペインの利益を右クリックしてビンを作成。
ビンのサイズで新しいパラメーターを作成を選択。
範囲の最小値を5,000、最大値を20,000、ステップを5,000にする。
利益(ビン)を列に、オーダIDの個別のカウントを行にしてグラフを作成するとヒストグラムができる。

【ポイント】
ビンのサイズもパラメータで変動可能。

アドホック計算でWINDOW_MAX関数を使い最大数を色付けすることが可能
WINDOW_MAX(COUNTD([オーダー Id]))=COUNTD([オーダー Id])


Q4.顧客ごとの数量と利益の分布をみたとき、数量が多いときに利益が上がりやすい傾向にあるカテゴリ・地域の組み合わせはどれですか︖ なお、R-2乗やP値は考慮しなくてよいです。

顧客名、数量、利益の散布図を作ってから、列に地域、行にカテゴリを置く。傾向線をひくと「四国の家具」の傾きが一番大きい。

【ポイント】
同じチャートをクロス集計表の形で並べる表現をスモールマルチプルという

通常、色は一つのディメンションでしか設定できないが、スモールマルチ
プルの状態から地域を色に、カテゴリを詳細において、その後カテゴリの
詳細アイコンをクリックして色に変えると、地域とカテゴリとで二種類の色を設定できる


Q5.カテゴリごとに顧客区分の売上の割合を⾒たとき、「⼤企業」で売り上がった⽐率が最も⼤きいカテゴリはどれですか︖割合は各カテゴリを100%として計算してください。

各カテゴリを100%とした積み上げ棒グラフを作成するため、行に顧客
区分、列に売上、カテゴリを色にする。売上の簡易表計算→合計に対する
割合→次を使用して計算→セルを選択する。

【ポイント】
積み上げ棒グラフはデフォルトで軸の最大値が多めに設定されているので、
100%積み上げ棒グラフの場合は軸の最大値を100に変更すると良い。

・表計算のTips
 レコード数という計算式フィールドを作成して1を入力しておく。
 使いたいディメンションを使って表を作って、レコード数を最小値にして
 累計カウントで計算する。表計算の編集でどの方向の計算かがわかる
 ので、迷ったときはこれで確認すると良い。

表計算のTips

Q6.2016年に1カテゴリ単体で20万円以上購⼊している顧客を教えてください。 1カテゴリごとに切り替えて表⽰できるようにしてください。

オーダ日で2016年にフィルターし、カテゴリをフィルターに表示する。
顧客名を行に、売上を列にしてグラフを作成する。

パターン①
売上をフィルターにD&Dして最大値を20万円にする

パターン②
顧客名をフィルターにD&Dして条件を売上20万円以上にする。
オーダ日とカテゴリのフィルターをコンテキストフィルターにする。

【ポイント】
クエリパイプラインによりフィルターの適用順が変わるので要注意。
コンテキストフィルター>ディメンションフィルター>メジャーフィルター

クエリパイプライン

Q7.各地域ごとの売上TOP3サブカテゴリを⾒たとき、全ての地域で存在している(TOP3にランクインしている)サブカテゴリはありましたか︖なお、TOP5で⾒たい⼈やTOP10で⾒たい⼈もいるようなので、ビュー上で変更できるように⼯夫して下さい。

地域とサブカテゴリを行に、売上を列にして棒グラフを作成。
売上を複製して簡易表計算のランクにする。
売上のランクを不連続に変更し、列に入れてヘッダとして使用する。
売上のランクをフィルターにもっていく。
不連続のままだと煩雑な表示になるので、連続に変更してフィルターの種類を最大値に変更する。

【ポイント】
サブカテゴリのフィルターで売上TOPNを作成すると、サブカテゴリの中のTOPNを地域別に表示しているだけなので、すべての地域で同じサブカテゴリが表示されてしまうので、ランクでフィルターする必要がある。


Q8.カテゴリを絞ってメーカーごとの売上を確認しつつ、別の画⾯で気になったメーカーの売上明細を⾒ることはできますか︖

Ord3のQ2の復習。

【ポイント】
メーカーをブレンドで結合→製品Idの項目で結合→製品Idとメーカーを行にD&Dして右クリック→プライマリグループの作成→メーカーの名前で登録。
※この処理をしないとフィルターアクションで選択できない


Q9.時系列に週ごとの売上推移を確認したいのですが、各週の売上をそのまま推移にしてしまうと特殊な売上などがダイレクトに反映されてしまい、傾向が⾒えづらいです。現在の週を含めた過去12週間の移動平均を⾒て、何⽉の週が売上の⼤きい傾向になるか教えてください。なお、12週間に満たない期間の売上は表⽰しなくて構いません。

オーダ日の週(連続)を列に、売上を行にして線グラフ作成。
売上を簡易表計算→移動平均→表計算の編集→前12を入力。
11月の週の売上が大きい傾向にあることがわかる。


Q10.2014年にオーダーされた注⽂について、売上⾼の合計が20万円を超えた製品はいくつありますか︖シート上で⼀⽬⾒てわかるように⼯夫してみてください。

Q6~7の復習。
オーダ日を2014年でフィルタ、売上でフィルタ→最小値20万
売上をコピー→ランク計算→不連続に変更してヘッダとして使う。

【ポイント】
メジャーフィルタはディメンションフィルタより後に適用される。
ランクを不連続にするとヘッダとして使用できる。


Q11.明細(1⾏)単位の売上をサブカテゴリごとにみたとき、外
れ値を除いた最⼤値が最も⾼いのはどのサブカテゴリですか︖
また、そのサブカテゴリのオーダー回数は他と⽐べて多いですか︖少ないですか︖

列にサブカテゴリ、行に売上を置く。
1行単位の売上(非集計)にするため、売上をディメンションに変更する。
グラフを円に変更してサイズを小さくして、アナリティクスペインの箱ひげ図を選択する。オーダIDの個別カウントを行に追加して棒グラフを作成。
外れ値を除く最大値はテーブルが最も高く、オーダー回数は少ないことがわかる

【ポイント】
メジャーをディメンションに変更すると非集計になる。

箱ひげ図を使うことでデータの分布と外れ値が確認できる。


Q12.全地域の売上をマーケティング施策によりそれぞれ10%ずつ向上させたいと考えています。しかしマーケティング費⽤も限られているため、全カテゴリに対して施策を打つことができません。施策を打つと元の売上から10%,20%と10%単位で向上できると仮定して、最も少ない%で全地域の売上10%UPを達成できるマーケティング効率のよいカテゴリはどれでしょうか︖
また、その際何%UPする必要があるでしょうか︖なお、基準になる売上は2016年のものとします。

利益率シミュレーションのパラメータを作成する。パラメータ名は「利益率シミュレーション」とする。データ型は浮動小数点数、範囲で0.1~1、ステップサイズは0.1、表示をパーセントに設定。

カテゴリ選択のパラメータを作成する。パラメータ名は「シミュレーション対象カテゴリ」とする。データ型は文字列、許容値はリストを選択し、値の追加元でカテゴリを選択する。

売上高のシミュレーション計算を作成する。名前は「売上×N%」とする。
IF [カテゴリ]=[シミュレーション対象カテゴリ] then [売上]*(1+[利益率シミュレーション]) else [売上] end

列に地域、行に売上高のシミュレーション計算のフィールドをおく。
オーダ日を2016年でフィルターする。
売上高が110%超えている場合に色づけするため、アドホック計算で
SUM([売上×N%])>SUM([売上])×1.1を入力し、色に設定する。
売上を詳細にD&Dし、分布をバンドで売上の100%と110%の線を入れてブレットグラフを作成する。

パラメータで家具と%の組合せを見ていくと、最も効率が良い組み合わせは家電の40%であることがわかる。


Q13.各製品の売上を⾒ながら、同⼀画⾯内でに製品名をWeb検索することはできますか︖

製品別の売上グラフを作成し、ダッシュボードに配置。
ダッシュボードのオブジェクトのWebページを配置し、Googleの検索ページを入力。ダッシュボードのアクションの追加で、URLに移動を選択し、URLターゲットでオブジェクトのWebページを選択。
URLにhttps://www.google.com/search?q=<製品名>と入力する。
ダッシュボードのグラフで選択した製品名でGoogle検索がされるようになる。

【ポイント】
アクション実行対象をメニューにするとツールヒントにリンクを表示可能。ツールヒントにはアクションの名前が表示されるので、「<製品名>について検索」のように一目見てわかるような名前で登録しておくと良い。


Q14.オーダー⽇の四半期単位での売上推移を出荷モード別に確認し、各出荷モード別の2年後の予想売上を算出したいです。2年後に第2位の売上を出しているのはどの出荷モードですか︖なお、予想モデルは⾃動で構いません。

オーダ日は四半期(連続)を選択し、売上の線グラフを作成。
出荷モードを色に入れて、アナリティクスペインの予測をD&Dすると予測値が表示される。実績と予測の間の線が切れているが、予測インジケータを属性に変更するとつながる。

【ポイント】
実績と予測でディメンションが区切られているから線が途切れる。
予測インジケータを属性にすることで出荷モードのみでの色分けになる。

・Ord3の復習
 属性=集計単位(LOD)として使われていないもの
 LODとして認めてほしくないけど情報として入れたい場合などに使う


Q15.サブカテゴリの数量と利益の相関をオーダー年の推移で確
認したいです。2015年までの3年間で数量も利益も順調に成⻑したといえるサブカテゴリはどのカテゴリに所属しているでしょうか︖また、そのサブカテゴリは2016年にどうなっているでしょうか

数量、利益、サブカテゴリで散布図を作成、カテゴリをラベルに表示。
オーダ日(年)をページにD&Dするとボタンで年の推移を切り替えられる。
履歴の表示にチェックを入れて表示の末尾にチェックをすると推移の履歴が線で表示できる。
答えは本棚と椅子がある家具カテゴリ、2016年には落ち込んでいる

【ポイント】
次の履歴を表示するマークでハイライト済みを選択すると、グラフ上で選択したサブカテゴリのみの線が表示されて分かりやすい。



この記事が気に入ったらサポートをしてみませんか?