見出し画像

初めてのふて寝(LODで挫折・・・這い上がって追記!!)

苦難の訪れ・・・

DATASaberの勉強って、まとまった時間が必要だよね・・と同じ担当のApprenticeと話していました。すきま時間には出来ない種類です、はい。
この時期特有の業務や、大切な方々の歓送迎会・・・結果平日の夜は使い物にならず 笑

この土日はやっと勉強を、と。いろいろと計画を立てていたのに・・
Oredeal8!!!!
難しすぎてうなる…解説動画を見てもできない、わからない・・・
やっとの思いで2日目の今日、夕方回答を提出しました。。。

LOD計算

避けては通れないLODがついにやってきました。。。
自分のために・・・一旦簡単に記録します。

LODとは

Level Of Detail の略、直訳すると「精密さの度合い」、
Tableauでは「集計レベルやデータの粒度」と表現されることが多いと思います。
はい、それは知っていました。ほぼ用語の意味としての理解です。

今回TKさんの動画ですごくわかりやすい言葉がありました。
「LOD表現で自分の行にないものを集計してもってこられる」
Ordeal8の問題文を見て、解き方がまったくわからなくなったのは、
今までは自分の行の中(ビューのLOD)で対応できていたからであって、今回、それだけでは、求められているデータを表現できないからだったんですね。

都道府県別の売上の棒グラフ
このビューのLODは「都道府県」

「この単位で集計してくださいね」という優しいディメンションのみでは先に進めなくなったということです😂

いざLOD表現へ

Ord8で初めてLOD計算を自分で作成しました。
計算式が大の苦手な私が!!

まずはこれ!!

これは顧客IDを「最初のオーダ日」という粒度で集計する計算式
KTさんの言葉をお借りすれば
「何があってもこの粒度で出す」いわば宣言のようなものと思えばいいのでしょうか。(結構この言い方わかりやすかったです)

Ord8では複数のLOD表現で問題を解いていきました。
それぞれこんな風に書くようです。
 FIXED
{EXCLUDE <ディメンション>:集計関数(<フィールド>)}
 INCLUDE

{}のことをブレースをいうそうなのですが、
TKさんが空耳したみたいに、私も「ブレスレット」と覚えました。
少しでも楽しくしたい・・・😅
全然足りていませんが、今日はここまで・・引き続きLODを学びます。

初めて立ち止まった

Ordeal8をやり始めて
「自分はDATASaberに挑戦する資格がないんじゃないか・・」と思いました。後ろ向きになったのは、この2か月間で初めてかもしれません・・・
そのくらい、難しかったし、同じことができるレベルになるまで、あとどのくらいかかるのか・・・・とても不安です。あと1か月しかないのに、このレベルでいいのかな、と思っています。
これは挫折なのか・・・ 
途中ふて寝して、逃げたりもしたけど・・・結局、わたしもう少しがんばります👍

追記(その後のLOD計算の理解について・・・)

3つのLOD計算の違いがいまいち腹におちてこない・・
一番すっと理解できたのはFIXEDです。
「INCLUDE」と「EXCLUDE」についてもまとめておこうと思います。

参考にしたサイトです(師匠からお聞きしました)

それぞれの意味

VizLODを基本とした状態で
「INCLUDE」→追加する
 ・・・・・・ INCLUDEの計算式内で指定されたディメンションをシート内のディメンションに追加 
「EXCLUDE」→除く(なかったことにする)
・・・・・・・ EXCLUDEの計算式内で指定されたディメンションから外す
 ※粒度(ディメンション)は増やせば細かくなるし、除けば粗くなる・・・
「FIXED」→そもそもVizLODとは関係ない
使うディメンションを指定してその粒度で計算をする

「INCLUDE」と「EXCLUDE」→Sheetの作りに依存する
「FIXED」→Sheetに対して独立している

ちょっと作ってみましょう。

まずはINCLUDE!

{ INCLUDE[地域] :SUM([売上])}
左は地域ごとの売上合計
右は顧客区分を加えたので、結果も
顧客区分別の地域ごとの売上合計になっています。

同じINCLUDE計算式でもシート上のディメンションによって結果が異なる

これって必要?って正直思いましたが、
色々な分析を進めるうえで、粒度を変更(細かく)していきたいときは
柔軟な性質(影響されやすい質)の「INCLUDE」が便利なのだと理解しました。

次はEXCLUDE
{EXCLUDE [顧客区分] :SUM([売上])}

除いたディメンション以外が粒度となる

この場合
除くディメンション(この場合顧客区分)に影響されないように
FIXEDでカテゴリごと!と指定して計算すれば、ずっとカテゴリごとの売上を見ることができます。

それはINCLUDEでも同じことがいえるわけで・・・

これらのLOD計算式をどのように使い分けていくかは
実際に求められる分析によっても違うし、もしかしたら自分が使いやすい計算式というのもあるのかもしれません。

LODの理屈はわかってきたので、あとは直感的に使えるかどうか・・
ここに固執していると必要のないときにまで、時間をかけてLOD計算を使ってしまいそうだな、と感じました。

あと気を付けなくてはいけないのが
「クエリパイプライン」ですね。
これも実際の操作を交えてまとめておきたいな、と思っています。




この記事が気に入ったらサポートをしてみませんか?