Tableau DATA Saberチャレンジ日記⑧

語彙力ゼロのダメリーマンによるDATA Saberチャレンジ日記の第八回は
七つ目の試練「7.Performance Best Practice」の振り返り(備忘録)です。


Q1.パフォーマンスが悪いとなぜいけないのですか?

  • 答えを得るのに時間がかかる

  • フローに乗れない

  • イライラする

  • 本当のTaskを忘れる

パフォーマンスが悪いと、答えを得るのに時間がかかってイライラする、
分析のフローに乗れない、時間を短くするための解決策を考えることがTaskになってしまう。


Q2.表計算はどこで処理されますか?

表計算はTablaeuで処理されている。


Q3.JOIN(結合)はどこで処理されますか?

JOIN(結合)はデータベースで処理されている。


Q4.Tableau Desktopで表示が遅くてもTableau Serverで高速に表示できる

Desktopで遅いものはSeverで早くなることはない。


Q5.次の内Tableauのシートで作業する前に件数を減らせるフィルターを選びなさい

  • 抽出フィルター

  • データソースフィルター

抽出フィルターとデータソースフィルターがシートでの作業前のフィルター

クエリパイプライン

Q6.データの集計が遅い場合、DBで事前にテーブルを準備してもよい

集計されたデータを用意しておく等、事前にDB側でテーブルを準備しておくのも有効。


Q7.売上のトランザクションデータと地域マネージャーのマスターデータのテーブルがある。これらのテーブルは同じスキーマ内に存在している。一般的に適切と思われる結合方法はどれか?

  • トランザクションテーブルとマスタテーブルの結合

    1.  同じデータベースの場合:結合

    2.  違うデータベースの場合:クロスデータベース結合

  • トランザクションテーブル同士の結合

  ブレンド 


Q8.売上のトランザクションデータと在庫のトランザクションのテーブルがある。これらのテーブルは別のデータベースに存在しており、異なる粒度でデータが格納されている。商品単位での売り上げと在庫とを比較したい場合、一般的に適切と思われる結合方法はどれか?

トランザクションテーブル同士の結合方法はブレンドが適切。


Q9.ライブ接続と抽出接続について正しいものを答えなさい

ライブ接続が早いか抽出接続が早いかは端末やSeverの性能等に左右される。


Q10.抽出は必要な粒度で集計した状態で作成することができる

データ抽出画面で「表示されているディメンションでデータを集計」に
チェックを入れると必要な粒度で集計した状態で作成できる。
(秒単位のデータを日単位にまとめる等)


Q11.行レベル計算を内包する集計計算を作成するときは

行レベル計算を内包してしまうと行レベル計算を再利用できなくなるので
行レベル計算と集計計算を分けて記載する方が良い。


Q12.地域項目の中に入っている値「北海道」と「東北地方」を表示上「北日本」エリアとしてまとめたい。適切な方法はどれか?

ネイティブ機能を活用した方が良い。
ディメンションメンバーのグルーピングにはグル-プが有効。


Q13.右のような計算式を作成: IF [地域]="北海道" OR [地域]="東北地方" THEN "北日本" ELSE [地域] END
最も速く処理できるデータ型を選びなさい
※一般的なプログラミング言語やシステムについてではなく、Tableauの計算フィールドのパフォーマンスについて回答してください。

処理の速い順: 整数型 > ブール型※ > 文字型
※真偽を扱うための型


Q14.日付の列に「2019年06月06日」という形式でデータが入っており、文字列として取り込まれた。日付型に直す方法として最初に試すべきことは?

ネイティブ機能の日付型への変換を最初に試すべき。
関数の使用は最終手段。


Q15.日付のフィルターを作成したい。一番パフォーマンスがいいのは?

処理の速い順
相対日付フィルター > 連続型の範囲フィルター > 不連続フィルター


Q16.フィルターを自由に選べるように表示しておくことにした。パフォーマンスがよいのは?

項目がデータに依存しないクイックフィルターのほうが速いので、速さの順は以下の通り。

 複数の値(カスタムリスト) > 複数の値(ドロップダウン)


Q17.表示されたフィルターの「関連値のみ」オプションを使用すると

「関連値のみ」オプションを使用するとクエリが増えて表示が遅くなる。


Q18.クエリパイプラインとして正しいものを選びなさい

  1. 抽出フィルター

  2. データソースフィルター

  3. コンテキストフィルター

  4. FIXED

  5. ディメンションフィルター

  6. EXCLUDE/INCLUDE

  7. メジャーフィルター

  8. 表計算フィルター


Q19.Tableauは表示できるデータ量に制限がないため、数万行のテキストテーブルを表示するのが得意である

Tablaeuは大量のテキストテーブルを表示するのは苦手。


Q20.ダッシュボードのサイズは

表示されるべき形にしっかり固定しておくのが望ましい。


Q21.パフォーマンスのよいダッシュボードデザインは結果的に人が見たときにもわかりやすいデザインに通じている

見た目の良いダッシュボード=パフォーマンスが良いダッシュボード



この記事が気に入ったらサポートをしてみませんか?