Data Saver挑戦記④ 最終試験挑戦前の技術メモ

こんにちは😃 バスケ好き30代会社員のカックンです。
前回に引き続き、DATA Saberプログラムの挑戦記録を記したいと思います。
→前回の記事はこちら
→DATA Saberプログラムについて詳しく知りたい方はこちら

最終試験に向けてこれまでの課題を復習メモ

<Ord1>

■サブカテゴリごとに、売上と利益に加え、数量も同時に見せて
・利益を 売上 に挿入

・メジャーネームを 色 に挿入

・あとは 線  にして、 数量二重軸にすれば完成

■累計で見た時に差が開くのはいつから?
・セカンダリ計算

■サブカテゴリ、顧客区分 別で、割引率が高いものを相対的に見る
・割引率を 色 に挿入して、ステップカラーで2色にして、
 複数選択グループ化

■アクションフィルタ

ダッシュボード アクション フィルターの追加



■出荷にかかる日数を出す
DATE DIFF("day",オーダー日,出荷日)

<Ord3>

■都道府県の数字が地域にどう影響あるかをマップで可視化
・都道府県 の緯度を複製
・複製したマークの 都道府県を地域に差し替えあとは円グラフにすればOK

■2015年の売上と2016年の売上比較

・ IF DATEPART("year",オーダー日,)=2015 THEN 売上 END
それぞれの年の売上のみ計上される計算式を作成
・あとはリファレンスライン、バンドで比較表現

■レコード単位での売上比較
・フィルター  で  すべての値  を選択

■利益赤字顧客 の割合を知りたい
・フィルタ 顧客名  利益赤字(>0) でセット
・売上の中で赤字顧客セットを色で表現

■予算 との比較
・別エクセルをインポートする時は、新しいシートにドラッグドロップ
・データーインタープリタをして
 右に表示されている 予算 を一旦削除してから 分割されたファイルをユニオンしていく

・年月をまとめて選択して、ピポットする

・データ形式を 日付 にして、 フィールド名を 予算年月 にする
・他の 予算が入っているフィールド名 を 予算 にする

・まずは売上 で以下のVIZをつくる

・下段 売上欄に 予算を挿入し表示

・誤っている予算年月 に対し、 計算式 オーダー日として
  DATEADD("year",2,[予算年月])

・オーダー日をブレンドする

・予算シートの エリア を 地域 に名称変更し ブレンド
・予算シートの 製品カテゴリ を カテゴリ に名称変更し ブレンド

・別シートにて カテゴリ のテクノロジーを 家電 に変更

・メジャーバリュー 予算 を、詳細 に入れてリファレンスライン 設定
・みたい達成率 にてリファレンスバンド 設定 

<Ord5>

■売上区分別 売上金額別で分けよう
・IF SUM売上 <=数値 THEN "●万円"
    ELSEIF  SUM売上 ・・・・
 ELSE "◯万円" END

■ダッシュボードで 利益・売上を選択して、各シートをどちらかで見せたいとき(もう片方は色)
・パラメータ 整数リストで 売上 利益 を設定

・以下2つの計算式を作成し、行、色に挿入
・IIF パラメータ売上または利益を選択 =1,利益,売上
・IIF パラメータ売上または利益を選択 =1,売上,利益

■2016年に、1カテゴリ単体で20万円以上購入している顧客を教えてください。1カテゴリごとに切り替えて表示できるようにしてください。
・複数のフィルターを優先度をつけて機能させるには、それぞれをフィルタに入れて、メイン優先度(今回で言うと顧客名)以外をコンテキストフィルタにする

■地域別のサブカテゴリ別売上ランク をパラメータで切り替えて見たい
・合計売上を複製し、ランクにして表計算編集で地域内ランクにして不連続にする

・作成したランクをフィルタに入れ  連続 を選択。
 最大  を設定。

■移動平均の出し方

・表計算 から移動平均 を選択

■明細(1行)単位の売上をサブカテゴリごとにみたとき、外れ値を除いた最大値が最も高いのはどのサブカテゴリですか
・売上 をディメンション
・箱ヒゲ図

■カテゴリ別に施策を打った時の売上向上をみたい
・まずはシンプルにこれを作る

・次に対象カテゴリ選択パラメータ

・次に売上◯%増加パラメータ

・計算式 対象カテゴリ売上◯%増加
・ IIF([カテゴリ]=[シミュレーション対象カテゴリ],[売上]*(1+[売上*◯%増加]),[売上])

・対象カテゴリ売上◯%増加を行に
・売上 を詳細に
・リファレンスバンドで売上 110% 
・色計算式で 110%達成で青
SUM([売上◯%増加])>=SUM([売上])*1.1

■散布図で推移を追ってみたい
・ページにオーダー日(経緯を表したい項目)を       
・履歴の表示 末尾表示

<Ord8>

■データ内の最も新しい日付を基準日としたとき、最終購入日から基準日までの日数が60日未満の顧客は何名いるでしょうか?
・①計算式で 各顧客の最後のオーダー日 を作成
 FIXED 顧客ID :MAX オーダー日

②最新データ (最新オーダー日)

・FIXED :MAX オーダー日

③ 期間集計
・DATE DIFF 

④それをビンにして 顧客IDをカウント

■顧客の購入回数別で、最も顧客数が多い購入回数はどれですか
①各顧客の購入回数 
・FIXED 顧客ID COUNTD オーダーID

②各顧客の購入回数  をビン作成

③ 平均1オーダーあたりの金額
・INCLUDE オーダーID :SUM売上

④ 平均にして行に挿入

■顧客ごとの合計売上を見たとき、どの金額レンジ(10万円単位)の顧客が多いでしょうか?
①顧客毎の購入金額

②顧客毎の購入金額ビン を作成し、顧客IDをカウント

■各顧客を初回購入年毎にまとめて、オーダー年毎の売上を割合で表現してください。
①顧客別初回オーダー日
 FIXED 顧客ID :MIN オーダー日

② ①顧客別初回オーダー日を 色に追加  割合表計算

■初めて購入した顧客が、2回目に購入してくれるまでに何四半期空いていることが多いですか?顧客ごとの初回購入四半期ごとに見せて。

①顧客別2回目以降のオーダー日
 IIF オーダー日 >顧客別初回オーダー日,オーダー日,NULL

②顧客別2回目オーダー日
 FIXED 顧客名 :MIN 顧客別2回目以降のオーダー日

③顧客別1回目と2回目オーダー日の差
 DATEDIFF  

④顧客別1回目と2回目オーダー日の差 を列にディメンション不連続で
 顧客別初回オーダー日を オプション移動で四半期毎で行に
 顧客IDカウント を色に

■購入月(年は除く)と曜日の組み合わせで、1日あたりの売上平均が高い組み合わせを教えてください。
①日当たり売上
 INCLUDE オーダー日:SUM売上

■顧客別の購入間隔の平均(初回購入~最終購入の月数÷購入回数)ごとの顧客数と売上を見てください。
①顧客別の購入期間(月)
 FIXED 顧客ID : DATEDIFF month, MINオーダー日,MAXオーダー日

②顧客別の購入回数
 FIXED 顧客ID  :COUNTD オーダーID

③顧客別の平均購入期間(月)
 ROUND ①/②

④ ③顧客別の平均購入期間(月)をビンにする
 顧客IDをカウント、売上も見せる

■サブカテゴリ「テーブル」の最後の年(2016)の売上は、最初の年(2013)と比べて何%増加していますか?
表計算 対前年 差分の割合 基準を 最初  に設定

■年四半期ごとサブカテゴリの売上ランキングの推移をみたとき、最も長い間、継続して1位を獲得していたのはどのサブカテゴリか?
・地域 を色に。売上ランクでサブカテゴリを基準に設定
・軸の編集で反転 も忘れずに

■利益TOP10、WORST10の顧客の売上を比較し、利益でTOP1の金額を出している顧客の売上とそれ以外の顧客それぞれの売上の差を見せて。
・利益TOP WORSTをセット
・列に利益、売上、売上ランク入れて、行に顧客名
・作成した利益TOP WORSTセットをフィルタに
・TOP10 を行に入れる(イン・アウト)
・合計売上を複製し、計算式を書き換え
ZN(SUM([売上])) - LOOKUP(ZN(SUM([売上])), FIRST())

■年四半期の売上が最高記録を更新したのは何回ありますか? 売上が最初に発生した四半期は回数から除いて下さい。 
なお、最高記録を更新したタイミングがわかるよう、その箇所は色を変えて表現してください。

・①売上累計 にて 最大値 を選択

② ①を行複製し、 以下計算式を色に
INDEX()>1 AND RUNNING_MAX(SUM([売上]))=SUM([売上])

■サブカテゴリごとの売上と売上の前年比成長率の相関を年ごとに確認したいです。2015年と2016年で前年比割れしてしまったサブカテゴリの傾向を教えてください。
役員がモバイルで確認するため横に並べて各年を比較することができず、フィルターで切り替えて確認できるように依頼されています。
①売上前年比
売上表計算 基準を 前の に設定

② オーダー日を複製し以下計算式を 
LOOKUP(MIN(DATEPART('year', [オーダー日])),0)

■出荷にかかる平均日数を週単位の推移で見せてください。社の方針として上方管理限界線(UCL:Upper Control Limit)を3σとして管理しているのですが、Q8-1: この限界を突破して配送が遅延した週は何回ありましたか?

①出荷にかかる日数
DATEDIFF  "day"  ,オーダー日,出荷日

② 平均線ひく 
③リファレンスライン 分布 標準偏差3  で設定

④ 以下計算式を色に挿入
AVG([出荷にかかる日数])>WINDOW_AVG(AVG([出荷にかかる日数]))+WINDOW_STDEV(AVG([出荷にかかる日数]))*3

その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。


■2016年の四半期単位の売上推移をメーカーごとに比較してください。メーカー名が「s」で終わるメーカーにはどのようなトレンドが?
メーカーの情報はExcelに入っていないので、「サンプル - スーパーストア - メーカー情報.tdsx」を使用して.

①  メーカー名 をフィルターに入れ ワイルドカード で S  を指定

■地域別売上ランキングの推移を年四半期で見たとき、売上開始当初(2013/1Q)と最終四半期(2016/4Q)でランキングの変動があった地域はどこ?

①  地域を色に入れ、 売上を以下の通りランク(地域を基準に設定)

②最初と最後のランクを比較する以下計算しきを作成しフィルターに入れる

FIRST()=0 OR LAST()=0

■カテゴリ「家電」における週数別の売上を見たとき、500,000円を連続で超えたのはQ11-1: 最大何週間ですか?
※閾値500,000はシミュレーションで変更される可能性があるので可変にしてください。閾値を超えた週を異なる色で強調した上で「閾値超え連続週数」を数えて下さい。閾値超えが途切れたら、ゼロリセットし、閾値超え連続週数の値を連続した週の最後の週にのみ表示して下さい。

① パラメーター閾値を設定

② 計算式 閾値判定 を作成

計算式 超過週累計 を作成
IF [閾値判定] THEN PREVIOUS_VALUE(0)+1 ELSE 0 END



③ 計算式  超過売上高累計 を設定
IF [閾値判定] then PREVIOUS_VALUE(0)+(SUM([売上])-[閾値]) ELSE 0 END

④ 計算式  超過週累計表示 を設定
IF LOOKUP([超過週累計],1) = 0 and [超過週累計] > 0 then [超過週累計] END

④ 以下のように組み込み、ラベル は最大のみ表示






この記事が気に入ったらサポートをしてみませんか?