Tableauデータガバナンス・今から考えとかないと絶対後悔する10のこと!
近頃益々、重要性が叫ばれる「データガバナンス」ですが、自分にはまだ関係ないかな?と思っているTableauユーザーの方もいらっしゃるかもしれません。特に、Tableau を導入して可視化を始めたばかりの方はにとってはCereator 仲間をもっと増やそう! とにかく使ってもらえるダッシュボードを増やすことに精一杯になりますよね。
でもちょっと待ってください‼ 今のうちから「データガバナンス」を念頭に置いたダッシュボード開発や展開をしておかないと、後から大きな後悔をすることになるかもしれません!
今日はこれからTableaを組織で広げていきたいとお考えのTableauユーザーの皆様に、データガバナンスについて、「今から考えとかないと絶対後悔する10のこと」を紹介していきたいと思います。
データガバナンスってそもそも何?
その気持ち、分かります! ざっくり「データガバナンス」って言われても、なかなかふわっとしていて想像がつかないですよね。
データガバナンスとは何ですか? と調べると:
「データガバナンスは、データの品質と信頼性に関する活動であり、データの正確性、信頼性、コンプライアンス、セキュリティを確保するためのルール、ポリシー、および手順を確立します。」とあります。
分かったような気もしますし、何となくピンとこない気もしますね。
もし、世の中に、Tableau でデータ分析をする人が自分一人だったら、好き勝手にやったら良いわけですが。組織の中には作り手がいて読み手がいて、データソースを作る人がいて、使う人がいて、時にはダッシュボードを複数人で管理したりして。みんなが混乱し余計な作業が発生しないようにルールに従い、心地よくデータ活用できる環境を作っていかなければなりません。
データガバナンスはデータ分析活動における、交通ルールと一緒だと考えてみましょうか? 交通ルールがなければ街は大渋滞に、場合によっては大事故が発生してしまいますね。
そう考えると、データガバナンスのないデータ分析・・・ちょっと怖くなってきませんか?
では実際に、データガバナンスについて今、考えておかないと後悔するかもしれない事柄を10個上げてみましたので、紹介していきましょう!
① ダッシュボードが多すぎてどれを見たらいいのかわからない!?
【あるある】組織内でTableauを活用していく過程で、ダッシュボードが増えすぎて整理が追いつかず、どれを参照すべきか迷う状況が発生します。似たような内容のダッシュボードが複数存在することで、利用者が混乱するケースも少なくありません。
【解決策】ダッシュボードを重要度に応じてクラス分けをしましょう。
1. **重要クラス**:組織全体で必ず参照する主要なダッシュボードをここに分類します。このクラスでは、どの機能にどんなダッシュボードが必要かを明確化し、変更管理のルールも厳密に設定します。
2. **サンドボックスクラス**:自由にダッシュボードを開発できる環境を提供し、試験的なアイデアや新しいニーズを反映させます。ここで有用性が確認されたダッシュボードは、重要クラスに昇格させる仕組みを導入しましょう。
② 元データをどうやって作ったかわからない
【あるある】時間に追われてダッシュボードを急いで作成した結果、データの出所や加工プロセスが不明確になり、後から再現できない、または信頼性が損なわれる問題が発生することがあります。
【解決策】データの来歴(リネージュ)を記録する:
1. **データソースの出典を明記**:ダッシュボード上にデータのダウンロード元や出所をキャプションとして記載します。
2. **ETL処理の可視化**:Tableau Prepを活用してデータ処理フローを保存し、必要に応じてコメント機能を使って処理内容を明示します。
3. **再現性を確保**:データ加工の手順を記録しておくことで、後から同じ結果を再現できるようにし、不要な混乱や手戻りを防ぎましょう。
これらの取り組みにより、データの透明性と信頼性を高め、効率的な運用を実現できます。
③ 見る人によってデータ項目の意味が違う。
【あるある】 同じダッシュボードを見ていて「売上」と言われたも、粗利益なのか、販管費を引いた営業利益なのかで全く意味が違ってきます。
【解決策】部署ごとに「当たり前」と思っている言葉の定義は変わるので、ビジネス用語ディクショナリ(データディクショナリ)を作成して関連メンバーで認識を統一すると良いでしょう。
④ データとダッシュボードの責任者不在!
【あるある】 マーケティング効果として売上にどれだけインパクトがあったのか確認したい!と思っても売上データは組織の中のだれに言えば参照できるのかわからない! ということがあるかもしれません。
【解決策】 データが欲しいけど誰に聞いたらいいのかわからないということを避けるために、組織の中でそもそも、どのようなシステムにどのようなデータが蓄積されるのか、誰が担当なのかを明確にする大まかな俯瞰図を作成しておくと良いでしょう。
⑤ テスト環境を準備していないため、リリース後に本番環境で障害発生!
【あるある】 テスト環境!?そんなのいらないでしょ!と思っているそこのあなた!今から考えておかないとたいへんなことになりますよ! 皆が利用するダッシュボードについては、ちょっとした変更によって動作がおかしくなった場合、大きな混乱が発生してしまいます。
【解決策】重要なダッシュボードであればある程、注意を払って変更のリリースが必要です。必ず本番環境と同様のテスト環境を用意して、本番同様の動作テストを実施し、テストをクリアしたダッシュボードについて本番環境にリリースをする手順を確立しましょう。Tableau の場合はテスト用のサイトを別に立てなくても、テスト環境をプロジェクトフォルダとしても良いでしょう。データソースについても同様にテスト環境の準備を検討しましょう。
⑥ 変更手順とバージョン管理がないため、いつの間にか動作が変わって大混乱!
【あるある】時間がない!早く直さなきゃ!と思ってダッシュボードをとりあえず修正してしまうということもありますね。わかります。その気持ち・・・。ただ、変更内容の履歴を残しておかないと思わぬ災害が発生してしまうこともあります。
【解決策】多くの人が同じダッシュボードに変更を加える場合は、変更を知らずに誤った変更を重ねてしまったり、変更した自分自身が詳細内容を忘れてしまった!なんていうこともありますね。Tableau Server / Tableau Cloud ではリビジョンの管理(バージョン情報)と変更日時が確認できますので、この情報と変更内容のメモをスプレッドシートで管理したり、ダッシュボード自体にコメントを残すなどの工夫や、ダッシュボードのファイル原本自体をGitでリポジトリ管理するといったこともできるでしょう。
⑦ データソースのモデリングがされていないので、分析対象のデータセットを作るのに時間がかかる!
【あるある】例えば皆で共通して使えるマスターテーブルとトランザクションテーブルの整備がなされていない場合、BIツールから利用するために必要なデータを取り出すために、それぞれのダッシュボードクリエーターが毎回試行錯誤してデータ準備をする必要が出てきます。データ準備が個人の裁量に任されるため、作業が重複したり、データ準備の方法が属人化して人によって違う結果になる!ということも・・・
【解決策】共通で利用できるマスター表とトランザクション表はできるだけ共通化し、スキーマ図を作成しておくことでどの表を組み合わせれば良いかわかりやすいようなガイドを作っておくと良いでしょう!
⑧ データは有るけど分析できるような品質ではない!
【あるある】データはあると言われて見てみたけれど。顧客名にはスペースが入っていたりいなかったり、半角全角混じっていたり、入力者が必要な区分を入れてくれていなかったり、有効な範囲でなかったり・・・こんなことは有りませんか?せっかくデータを集めたのに、中身を見て見て分析には使えない!とわかることも実は多くあります。
【解決策】分析を想定した入力のルールをしっかりと設計していくこと、またデータの小さいうちからアジャイルに分析を実施し、都度ルールを見直していくことが重要ですし、入力者にとっても正しくデータを入力してもらうことの大切さを伝え、正しいデータ収集に協力してもらえるような体制を作っていきましょう!
⑨ データの置き場所がバラバラ、EXCELファイルが大きくなりすぎて、もう無理!
【あるある】初期の段階でデータ量が小さいうちは、CSVやEXCELでデータソースを管理するのが楽ではあります。しかしデータ量が増えるにつれ、いずれはファイルでのデータソース管理では対応できなくなるのは明らかです。データソースファイル自体が点在していてどれが正しいかわからなかったり、過去データも含めてデータが簡単に書き換えられてしまうと分析結果を信頼することが出来ません。
【解決策】大規模データを一元管理しスムーズに利用できるデータベース上に保管することを今から検討しましょう。Snowflake, Bigqueryなどクラウド上のDWHソリューションを利用することで、データベース環境を自分で用意することなく、使った分だけ支払うことができるので、簡単に使い始めることが出来ます。
⑩ 良かれともって作ったダッシュボードに、見せちゃいけない秘密のデータが!
【あるある】できるだけ多くの人に使って欲しい!と思うダッシュボードではありますが、そのデータ本当に見せていいのでしょうか? 個人成績の情報や部門ごとにオープンできない情報など、重要なデータであるからこそ、適切にアクセスコントロールを考えていかなければいけません。
【解決策】Tableau のプロジェクト、ダッシュボードに対してグループやユーザーごとにアクセス権を設計しましょう。また同じダッシュボードでもデータ行ごとにアクセス権を制御する必要がある場合、Tableau の行レベルセキュリティーやデータソースとして利用するDWHが持っている行レベルセキュリティーの活用を検討しましょう。
将来的に事故に少ない住みやすい街づくりを目指して、あらかじめ交通ルールを整備するように、データガバナンスを想定しながらTableauの組織展開を考えてみてくださいね!