Ord9復習

お疲れ様です。
本日はOrd9の復習をします。
ord8と同じく、基本的に難しい応用問題ばかりです。
最終試験前にしっかり復習します。

★★Q1

最初の年(2013年)を基準として、2016年は2013年からどれだけ売上に差があるかを出す。
合計(売上)下向き▼から簡易表計算→差の割合で、前年の売上との差の割合を出せる。
前年の売上は基準を選ぶことができる。
合計(売上)下向き▼から基準→最初を選択する。

★★★Q2

椅子が利益に及ぼした貢献度を知りたい

ウォーターフォールチャート
椅子における各都道府県の利益の貢献度を、貢献度の大きさ=棒の長さで表す。
★作り方のポイント
・簡易表計算を累計にする。
・マークで「ガントチャート」を選択する。
・都道府県の下向き▼から並べ替えで「ネスト」、並べ替え順序「降順(大きい順)」、フィールド名「利益」を選択する。
★「ネスト」→並べ替え順序を決定するために使用するフィールドを選択できる。
・マークカードで合計(-[利益])をサイズにドロップする
 →利益の大きさが棒の長さになる
ATTR(地域)を色にドロップすると地域別で色分けできる。

★★★Q3-1

四半期ごとのサブカテゴリのランキング→ハイライトテーブルのような表で表す。

★区切って表示させたい時は不連続にする。
オーダー日→「四半期」を連続から不連続、売上のランク→連続から不連続にする

サブカテゴリごとのランクなので、合計(売上)下向き▼から次を使用して計算サブカテゴリにする。

マークを「棒」にする→枠内で横長に広げるため。
枠内の棒を広げるために集計(MIN(1))を列にドロップする
目盛りはMIN関数で1と指定しているが、頭の先端が見えるように目盛りがデフォルトで2になっているので、軸の編集で範囲を1で固定する。

★★★Q3-3

表自体はQ3-1と同じ。
違うのはATTR([カテゴリ])を色にドロップすること。
ランク表自体はサブカテゴリのままだが、色のみカテゴリ別に色分けできる。

★★★★Q4

結合セットの作成はOrd3Q5に似ているが、より難しくなっている。
合計売上、合計利益、合計売上の差を分かりやすく表示するための並び替え設定が難しい。

結合セットの作成
利益TOP10顧客、利益WORST10顧客をセットで作成。
利益TOP10顧客⇔利益WORST10顧客(両方のセットの全ての要素)で結合セットを作成する。これで利益TOP10、利益WORST10両方の顧客をViz上に出すことできるようになる。

<ディメンション>
結合セット、利益のランク(ソート用)利益のランク(表示用)、顧客名
<メジャー>
合計利益、合計売上、合計売上の差

<ディメンションについて>
結合セット、利益のランク(ソート用)利益のランク(表示用)、顧客名
★利益のランクはソート用と表示用ともに下向き▼から、次を使用して計算>ペイン(下)を選択する。
→1から10までのテキストが出てくる。

★顧客名下向き▼から並び替え>「ネスト」、「降順」、フィールド名「売上」を選択する。
→合計売上の差が0を上から順に並び替え出来る。

★なぜ利益のランクに表示用ソート用を用意したか?
利益のランク(表示用)
WORST10も表示している。
見た目で一番利益を生み出していない10位の顧客が一番上に表示されるように、表計算の編集>ランク、昇順、ペイン(下)を選択する。

利益のランク(ソート用)
利益は1位を上から順に表示したいから。

<メジャーについて>
合計利益、合計売上、合計売上の差
売上の差の設定
合計売上下向き▼から、次を使用して計算>表(下)、基準>最初

★★Q5

年四半期の売上が最高記録を達成した回数を出す。

列に合計売上を二つ用意する。
ひとつは線グラフ、もうひとつは円。
合計売上下ふたつとも、下向き▼から表計算の追加(もしくは表計算の編集)>累計、最大値、表(横)を選ぶ

二重軸を線グラフと円を重ねる。

★最高記録を達成した回数の出し方
INDEX()>1  AND  ②RUNNING_MAX(SUM([売上]))=SUM([売上])
①と②をANDで繋ぐ。両方達成していたら真、両方達成していなかったら偽になる。

RUNNING_MAX(SUM(売上)) → 指定された式の最大累計値を返す
この状態では最高記録の達成、未達成を分けることができない。そのために「=SUM([うり])」を追加して真と偽で色分けできるようにする。

INDEX()>1 → 要素が1より多い。

★★★★Q6

サブカテゴリ別利益率棒グラフの作成は簡単。
ワースト3位のサブカテゴリもすぐにわかる。
利益率ワースト3のサブカテゴリを除外するチャートの作成方法が難しい。
サブカテゴリ別利益率棒グラフと除外用チャートとダッシュボードで表示する。サブカテゴリを選ぶと除外用チャートが動くので、どれくらい変化するかが非常に分かりやすい。

まずフィルタの設定で選んだものを除外する設定にする。
(サブカテゴリをフィルターにドロップ>除外にチェックはOrd3Q1でもやったテクニック。Ord3の基本的なテクニックと難しいテクニックを一緒に使うことが当たりまえになっている。)

<除外用チャートメジャー>
除外用チャートも棒グラフのほうが分かりやすい。
利益率、{[利益率]} 
{[利益率]}は列シェルフで直接入力する。
 →「{}」でくくられたメジャーはLOD計算している

この式ではデータ内の利益率をLOD計算している。
この{[利益率]}がダッシュボードでサブカテゴリを除外したときに利益率が変化する分だけ棒が変化する。
★利益率
はダッシュボードで選択した項目の利益率を除外した後の利益率が何%かを表示できる。(フィルターで除外にチェックを入れているから)

★スタックマーク
分析タブ>スタックマーク>オフにすると、利益率{[利益率]} の棒が重なる。

メジャーネームについて
二重軸にした時点でメジャーバリューと出てくる。一緒に出ているので、色カードとサイズカードにドロップする。

今回はLOD計算を使って作成した。
ダッシュボードのセットアクションでも同じものが作成できる。

★★★Q7

年を選択の計算式が難しい。散布図の作成は比較的簡単。

行=合計(売上)の差の前年比成長率。
列=オーダー日(年)、合計(売上)
前年比成長率では2013年はNULLになるので、NULL以上を表示の設定にする。
フィルタで年を切り替えたいが、フィルターをかけてViz上に前年がなくなると前年比成長率は出せなくなってしまう。

そのために表計算で前年を取得する式を組む。
LOOKUP(MIN(DATEPART('year',[オーダー日])),0)

LOOKUP関数
行や列の値をずらす関数。今回の場合は対象年の一つ前を取得するために使う。
MIN(DATEPART('year',[オーダー日])) 
DATEPART関数は
指定した日付を値にして返す。
つまりMIN関数と一緒に使った上の式では、オーダー年の最小を返すことになる。
Lookpu関数MIN関数とDATAPART関数の組み合わせを使って、年を値として取得する。

★前年比成長率は2色にすると分かりやすくなる。
★スマホ画面に合わせたい時はダッシュボードに散布図を表示したあと
ダッシュボードタブ>既定のレイアウト>スマートフォンを選択する。

★★★★Q8

平均出荷日数週単位の推移(週単位の線グラフ)で出す。
平均出荷日数3σ以上を目立たせたいので、Q5と同じく線グラフと円を二重軸にする。
標準偏差を出すのが難しい問題。3σ=平均3つ分
オーダー日から出荷日までにかかる日数DATEDIFF関数で出す。
★標準偏差をリファレンスラインで追加
リファレンスラインの追加>分布>値で標準偏差>今回は-3,3 を選ぶ。

★平均出荷日数3σ以上超えているかを強調するために関数を併用する。
AVG([出荷までにかかる日数])>WINDOW_AVG(AVG([出荷までにかかる日数]))+WINDOW_STDEV(AVG([出荷までにかかる日数]))*3
 つまり3σを超えていたら真、越えていないときは偽を返す式

①WINDOW_AVG(AVG([オーダー日から出荷日までにかかる日数])
→ウィドウ内の[オーダー日から出荷日までにかかる日数]の平均値を返す。平均の平均のようになっているがAVG([オーダー日から出荷日までにかかる日数]のみにしてしまうと式は成立しなくなるので注意する。

②WINDOW_STDEV(AVG([出荷までにかかる日数]))*3
→ウィドウ内の[オーダー日から出荷日までにかかる日数]の標準偏差に3(3σのこと)をかけて返す

AVG([出荷までにかかる日数])>①+②で式を組み合わせる

平均出荷日数折れ線グラフは標準偏差が少し難しいが、
各市町村ごとの平均出荷日数棒グラフは比較的簡単に出せる。
ここでは各市区町村ごとの平均出荷日数を見ているので、市区町村下向き▼から並び替え>並び替え>ネスト、降順、フィールド名「出荷までにかかる日数」、集計「平均」を選ぶ。
★各市区町村ごとの平均出荷日数を不連続にして列シェルフの先頭に置く。これで平均日数の大きい順で並べ替えが出来るようになる。
並べ替えの設定を市区町村と同じにするとより分かりやすくなる。

2つのグラフをダッシュボードで表示する。
平均出荷日数折れ線グラフ側にフィルタをかける
と、平均出荷日数が3σを超えている市区町村のみを表示することができる。

★★Q9

メーカー情報をブレンディングで持ってくる。
メーカーをフィルターにドロップしてワイルドカードを後方一致「s」と指定すると、メーカー名の最後に「s」がつくメーカーだけが表示される。
2016年のみでフィルターかけるのも忘れない。

各メーカーごとの目盛りについて
各メーカーごとで売上の単位が違う。
各メーカーごとで合わせるために、売上で右クリック>範囲>各行または独立した軸範囲 を選ぶ。
これでメーカーごとで目盛りが変わる。
ゼロを含めるのチェックを外すと、より四半期単位の変化がを分かりやすい。
表現しているのはあくまで各メーカーごとの波うち具合で数値の大小ではない。メーカーごとの規模感は異なる

各メーカーごとに最後の値を強調したい。
以下のような式で強調させる。
If LAST()=0 then SUM([売上]) END
もしラストだったら売上を返すという式

今回の場合、売上の目盛り、グリッド線はない方が見やすい。

★★★Q10

地域別売上のランキングを見たい。
売上開始当初と最終四半期のみを見たときの売上ランキングの変動なので、
売上開始当初と最終四半期以外は表示されないようにしたい。
範囲選択で売上開始当初と最終四半期以外を全て選択して除外を選択すると、自動でVIz上から除外することが出来る。

★★★★Q11

カテゴリ家具において
(1)合計売上500,000円を連続何週間達成しているか
(2)合計売上500,000円の超過していた時、超過分のみの売上を累計した時もっとも高い累計金額はいくらになるかを答える。
500,000円の閾値判定パラメーター、PREVIOUS_VALUE関数の作成が難しい問題。

表自体は週ごとの合計売上。合計売上500,000円を達成しているかが分かりやすいので、棒グラフが一番分かりやすい。

閾値パラメーター
データ型を整数、許容値を範囲最小値を500000にする。

合計売上500,000円を連続何週間達成しているかの計算式
①閾値判定
の式を作成する
SUM([売上])>[閾値パラメーター]
売上が500,000円以上の時は真を返す
合計売上500,000円連続達成週を計算する式を作成する。
if  ①閾値判定  then PREVIOUS_VALUE(0)+1 else 0 END
真のとき(合計売上500,000円を超える)は1を足す、それ以外は偽として1を追加しない。
この式をラベルにドロップすることで、合計売上500,000円連続達成週を表示できる。ツールヒントにも表示できる。

合計売上500,000円を超過していた時に超過分のみを合計して、累計合計が一番高いのはいくらになるかを出す式
if [閾値判定] then PREVIOUS_VALUE(0)+(SUM([売上])-[閾値]) else 0 END
真のとき(合計売上500,000円を超える)は500000円を超過している分を合計する、それ以外は偽として何もしない。
それを週ごとで繰り返して、一番累計金額を高いところはいくらになるかを答える。

最後に

私は5/13に最終試験を受けることが決まっています。
それまでにOrd1、Ord3、Ord5、Ord6、Ord8、Ord9をおさらい出来て良かったです。
DATASaber試験、絶対に合格します!!!

この記事が気に入ったらサポートをしてみませんか?