【Tableau】LODとLOD表現(計算)の違い

Tableau導入プロジェクトで躓いた点や発見をTipsとしてまとめます。
導入時の参考にしてみてください!

背景

ダッシュボード開発において、クライアント要求事項をうまく引き出しながらダッシュボードやビュー構成を検討することはプロジェクト成功要因の一つです(一般的にこれらの要素は業務要件/システム要件として取り纏められますが、この辺りはまた別の機会に記事化しようと思います)。

この引き出す行為(つまりヒアリング)について、例えば以下の視点でしっかりと軸を定めてヒアリング→情報整理を行うことがクライアント期待値を満たすためのポイントです。

  • 導入目的:ダッシュボード導入によってどのようなビジネス効果が期待できるのか

  • 指標/分析軸:どのような指標(メジャー)をどのような軸(ディメンション)で分析(ビュー表示)すると、導入目的実現に向けたインサイト(発見や気付き)を獲得できるのか

特に上記は、Tableau導入フェーズでのクライアント要求はフワッとしていることが多いため、ここを曖昧にしたままダッシュボード開発を進めてしまうと、最終的にクライアントの期待値とズレてしまい、大きな手戻りが生じる→プロジェクト遅延・破綻リスクにつながるため細心の注意が必要です。

このようなリスクを回避するためにもTableau独自用語であるLOD(Level of Detail)LOD表現(計算)の概念をしっかりと理解し、導入目的に沿った指標/分析軸をいかに具体化(定量化)できるかがカギとなります。

そこで、今回は、LODLOD表現(計算)について振り返りの意味も込めて記事にまとめます。

概要

先ずLODLOD表現(計算)の概念は以下の通りです。
LODとLOD表現(計算)の概念の違いをおさえるのがポイントです。

  • LOD(Level of Detail):指標(メジャー)をどの詳細レベル(ディメンション)で集計(表示や分析)させるかを指します。つまり、上述の指標/分析軸を整理する上で必ず念頭に置く必要がある概念です。

  • LOD表現(計算):LODを念頭に整理した指標/分析軸について、ある特定の詳細レベルで集計するために計算式を用いて実現することを指します。Desktopの標準機能では対応できない場合に使用するケースが多く、FIXED、INCLUDE、EXCLUDEなどのキーワードを使って計算式を構成し、特定条件下でデータ集計方法をコントロールします。

要するに、LODはデータを集計するための分析軸/レベルの概念であり、LOD表現(計算)はその分析軸/レベルを制御するための具体的な計算方法のことです。

詳細

それではLODの具体例を説明します。
ワークブックは、いつもの「サンプル-スーパーストア.xlsx」で各年度の売上をビュー表示したもの用意しました。

LODの具体例

上記ケースをLOD視点で説明すると、「売上」という指標を「オーダー日(年)」といった分析軸/レベルで集計することとなります。

続いてLOD表現(計算)の具体例を説明します。
上記ケースの各年度の売上を前提により詳細レベルの分析を行いたい、例えば、初回購入年ごとに顧客グループを作り各年度の貢献度を比較したい(コホート分析)場合で考えてみます。
各年度の売上を表示するのは簡単ですが、本ケースの場合、各年度ごとに初回購入した顧客グループを求めなければならず、データペインにあるピルのドラッグ&ドロップだけで求めるのは難しそうです。。。

このようにあるメジャー(オーダー日)を他のメジャー(顧客ID)で集計するなど、分析軸/レベルが複数要素で構成される場合に活躍するのがLOD表現となります。

以下、本ケースの実装手順となります。

  1. 初回購入年の特定

  2. 初回購入年の適用

1.初回購入年の特定

各顧客の購入日(オーダー日)は以下の通りです。

各顧客のオーダー日

上記各顧客オーダー日よりLOD表現を用いて初回オーダー日を抽出します。

LOD表現で初回オーダー日を抽出

上記抽出した初回オーダー日のピルを「年」単位に変更し各顧客の初回購入年の特定ができました。
なお、LOD表現を含む計算フィールドを作成時のTipsですが、いきなり計算フィールド作成から入るのではなく、今回のようにメジャーやディメンションなどを表示させ何をどのような計算ロジックで集計したいのかを具体化しながら計算式を組むと効率的に作成できますので参考にしてみてください。

LOD表現で初回オーダー日を抽出

2.初回購入年の適用

最後に各年度の売上にLOD表現で生成した初回オーダー日を適用します。
結果、2020年に初回購入した顧客の貢献度が各年度で一番高く初期リピーター顧客に支えられていることが分かります。

各顧客の初回購入グループを適用!

おわりに

今回はLODとLOD表現の違いを中心に取り纏めました。
なお、LOD表現には3種類の計算ロジックがあります。この辺りは私の師匠であるmomoさんが記事化していますので参考にしてみてください。

  • FIXED(固定):特定のカテゴリやグループに注目して、その中での合計や平均などを出します。例えば「製品カテゴリごとの売上合計」を計算する時に使います。参考記事はこちら

  • INCLUDE(含む):ビュー(見ているデータの範囲)にかかわらず、特定の項目を必ず計算に含めます。例えば「すべての店舗の中で、各製品の売上合計」を見たい時に使います。参考記事はこちら

  • EXCLUDE(除く):特定の項目を計算から外す時に使います。例えば、「特定地域を無視した全体の売上合計」を計算する時に使います。参考記事はこちら


参考


この記事が気に入ったらサポートをしてみませんか?