見出し画像

Tableau Serverサイト運営の投稿-09

  • 事業会社でTableau Serverのサイト管理者を担当しています。(Tableau Cloudでない、自前のTableau Server管理です。

  • Tableauの利用が広がっていくと速度改善を目的に抽出処理が増えてきます。サーバ内のローカルファイルである抽出データは明らかに外部のデータベースより、Viz表示速度が早く、ひとたび、その速さを認識すると利用ユーザーの抽出エントリが多数発生し、今度はそのバッチ処理がボトルネックになります。過去の経緯を知っているユーザーは「Tableau前と比較して、大きく全体的に向上しているので理解できる。」のですが、Tableau後しかしらない新しいユーザーは、せっかちなものです。「自分が出社する前に出来て当たり前。」「他の人は知らないが、自分は重要業務を担っており、この抽出は朝一番に終わっていてほしい。」という声も出てきて、課題解消はなかなか難しいです。

  • ここでも現状把握のための抽出処理の可視化が必要になります。長時間化しているものを可視化して、抽出処理の所有者と短時間化を交渉しましょう。



抽出処理の現状を把握するダッシュボード


抽出処理についても、誰が、どのデータを、どのように(全量なのか差分あのか)、どのスケジュール抽出しているかを把握することが大事です。そのためダッシュボードでの分析が必要になりますが、その前にどのようなデータソースが必要でしょうか?例えば下記のようなものがあります。

抽出名
→抽出の名称を確認できるようにしましょう
ステータス
→成功/失敗/実行待ちなどでステータスを
 可視化しましょう。特に失敗は登録者が
 気づかず、そのままダッシュボードには
 古いデータのまま報告されている可能性が
 あります。これだと判断に影響を与えるので
 失敗の通知は必須です。
優先順位
→抽出は優先順位付けができます。起動時に
 キューに処理を書込みしますが、キュー
 読出しは数字の小さいものから優先です。
 処理を急ぐものは優先度を上げましょう。
抽出起動時刻
→抽出起動時刻です。
抽出開始日時
→キューから読出されて、実際の抽出の
 開始時刻です。
抽出終了時刻
→抽出の完了時刻です。
抽出処理時刻(分)
→datediff関数で計算します。
 抽出終了日時と開始日時の差分を
 取得しましょう。
→所有者
 抽出処理の所有者

ダッシュボードの分析

抽出処理時間(分)の長い処理は所有者と
調整して処理変更を依頼しましょう。
→項目数は本当にすべて必要か?不要な項目は
 ないか?
→格納対象レコードは本当にすべて必要か?
 ダッシュボードで見ないような
 古いレコードはないか?
→いつか使うかもしれないので、念のため
 格納しておきたいというニーズは本当に
 そうか確認しましょう。
 ダッシュボードの閲覧者には案外ニーズが
 なかったりします。
→それでも大容量サイズの抽出ニーズの時は
 朝でなく夕方に時間変更依頼しましょう。

おことわり

当記事のコンテンツについて、商用利用でない場合は許可なく転載して頂いて構いません。
転載の際は、当記事へのリンクを掲載し転載であることを明記してください。商用利用の場合は許可なく転載しないで下さい。
当記事のコンテンツについて、公開情報等から引用したものであり、かかる情報の正確性・適切性等については、これを保証するものではありません。
っておらず、また、これを保証するものではありません。

この記事が気に入ったらサポートをしてみませんか?