データ分析環境構築の考え方

先日参加したセミナー「"業務に活きる"BIツール活用術-データ分析の全体像」について、備忘録的にまとめます。

データ分析の全体像を把握する

ビジネスに継続的にデータ分析を活かしていくには、まずはデータ分析の全体像を把握することが大切。
データ分析はおおまかに3ステップに分けられる
「データの収集/取得」→「加工/蓄積」→「集計/分析/可視化」

データ分析のプロセス

これを踏まえて、データ分析のアーキテクチャ図を作成する。
アーキテクチャ図は「どのリソースが」「どの時点で関わるのか」の認識合わせに有効。データの流れの整理と、関係各所の洗い出しを同時に行うことで、各領域の課題/優先度の整理に繋がる。

データ分析のアーキテクチャ図

↓合わせるとこうなる。

データ分析のプロセスとアーキテクチャ

データガバナンスの設立

また、大きい組織ではデータガバナンスを設立した方が長期的運用に良い。
分析基盤の構築やアーキテクチャから、ビジネス要件の実現可能性やセキュリティ観点の安全性を両面からサポートするデータガバナンスが必要。

簡易的な組織図

次に、データ分析基盤の機能要件定義を環境構築アーキテクチャ図で表し、具体化していく。

データガバナンス機能と環境構築

環境構築とデータ利活用を両輪で動かす

ここまでデータ基盤構築の大枠についてまとめてきました。
次のステップのカギとなってくるのが ”データ利活用” です。
データ分析の環境構築を行う際は、環境構築と利活用を両輪で実現していくことが重要になってきます。
プロジェクトを成功に導くために必要なことは「現場とのリレーション」と「ストーリーの具体化」です。

利活用までのストーリーを具体化する

下記のように環境構築と活用目的の明確化を同時に進められたら一石二鳥。

目的を設定するためのPoC(概念実証)
現場の流れ:環境構築と活用目的の明確

具体的に「誰の、何の業務が、どれくらい、いつから、楽になるのか」を想定すると良い。

具体的に業務とリンクさせる

BIツールは「データソース」からコントロールできることが重要。
また分析結果の可視化については、事前にエクセルでイメージを作るとやりやすい!

機会学習とBIツールの連携

ローコード、ノーコードの機械学習も視野に入れた発展的なBI活用。
統計知識、プログラミングは必須になるが、機械学習ライブラリの利用も視野に入れて構築する。

機械学習ライブラリ連携位置づけ

データベースの再構築

構築順は「①データマート→②データレイク→③データウェアハウス」がオススメ。

データベースの構築

まず「データを○○で使いたい」という利用者の具体的な声が膨らんでいる状態をつくる。

構築の流れ

データウェアハウス構築のためには、部門横断的に共通指標が定義される必要がある!

データウェアハウスの役割

そして、最後にとても大事なのは「データ整備」
データ整備は「マスタ管理/IDの共通化/ログ生成」がマスト。
未来を見越して俯瞰的視点でデータベース構築について検討進めておくと◎

データの整備


この記事が気に入ったらサポートをしてみませんか?