2025年の崖から落ちそうなレガシー企業でデータ利活用を推進している話
この記事は データ基盤・BIツール・データエンジニアリング Advent Calendar 2021 の 15日目の記事となります。
はじめに
グループ会社の全社のデータ利活用を推進して欲しいと要望を受けて、データの専門部署を立ち上げました。そのグループ会社のシステム環境はレガシーであり、まさにDXレポートで書かれているような状況です。
この記事ではレガシー企業でデータ利活用を推進していく中で、見えた課題と行ったことを書いていきます。
本noteではデータマネジメントに関する記事を書いてますので、よかったらどうぞ~
データ利活用推進の経緯
約4年間、以下のようにデータ利活用の推進活動を行ってきた。
次の章にてその中で見えた課題を紹介します。
2018年の活動
・DMBOKをもとにデータマネジメント組織の立ち上げ
・アセスメントの実施
・全社横断のデータマネジメント組織の立ち上げ
2019年の活動
・Access,Excelの改善を中心とした全社のデータ利活用の推進
・BigQueryを用いた新データ環境の提案
・経営戦略に紐づくデータ戦略の策定
・教育教材の作成
2020年の活動
・BigQueryの導入
・全社のメタデータの整理
・MLを使った施策の検証
2021年の活動
・BigQueryへデータを集約
・情報項目の区分の整理
・グループ会社のデータの集約
システム・データ基盤編
データ基盤に接続できるのはaccessのようなツールのみ
データ基盤は情報系システムと呼ばれており、メインフレームとその他システムのデータがDWHに集約されてました。
ただ、データは個人を特定できる情報とデータ分析用の情報が混じっていたため、入室に金属探知が必要なセキュリティフロア内に設置されてました。
また、DWHに接続できるのはPCからAccessのようなWebツールからのみであり、CSVでの出力しかできないような状況でした。
そのため、レポートを出すためにも、以下のような手続きが必要でした。
DWW→Access→CSV→(セキュアから一般へ持ち出し)→Excel→メール
そこで、データの区分を行い、一般のフロアにデータ分析用の環境をBigQueryを用いて構築しました。
データ基盤ベンダーの言いなりになって無駄な投資をしている
セキュアフロアにあるDWHを刷新するという提案をベンダーに受けており、
これからの時代はリアルタイムでの情報取得が必要ということで、メインフレームおよびその他システムからの情報をリアルタイムで連携するように刷新を進めておりました。
ただ、上で書いた通りCSVでの出力しかできないような環境のため、まったく意味のない投資となってました。
ベンダーと話しても大した提案は出てこないので、Accessのようなツール以外にMLができるツールを導入して、MLした結果を周辺システムと連携できるように整えていきました。
データ利活用人材編
KPI分析のためのレポートが業務になっており、目的がなく集計されている
社内には「日報」と呼ばれている、レポートがいくつも存在しました。
データを見て改善案を出すのは偉い人がやるものという、認識になっており、集計するひとはレポートを出すことが目的となっており、何を集計しているのか、果たしてなんのために集計しているのかもわかっていない状況でした。
そういう状況だったため、作成している部門と日報で集計している項目の定義を明確にして、BigQueryで自動的に配信するように進めていきました。
SQLを学ぼうとせず集計するため、誰も変更できない
レポート集計している人は、昔作った人のSQLと手順を代々受け継いでいるような状況になっており、式の意味を理解しておらず改修もできないような人が大半でした。
セミナーを行い基礎の学習できる環境と、問い合わせのSlack部屋を作り継続して支援できる体制を整えました。
リリース後に数字を追う習慣がない
企画部門は数値目標を立てて施策を実行するものの、KPIツリーのようにドリルダウンして数値を計測する習慣がなく、リリースされるとほったらかしにされる、もしくは当初の目標はそっちのけでよかった点だけを見つけて報告するような状況でした。
データ利活用の基本として、企画のPDCAの回し方のようなE-ラーニング教材を作成し、強制的に受講させ企画の考え方を浸透させることをしました。
データの事はシステムが理解していると誤解をしている
メタデータの整理の一環で、DWHに入っているデータのカタログを作成していたのですが、ビジネス側にヒアリングしても、なぜビジネス側に聞くのかと、理解されず苦労しました。
繰り返しビジネス上のデータの意味については、システムではなく要件を決めている業務側が理解していることを伝えて徐々に支援してもらうようにしていきました。
会社編
機械学習・AIを銀の弾丸だと思っている
AIを使えば何でもできるというような風潮があり、他社がやっていればうちも同じようにAIを使えばできるはず、といった自社のデータ環境を理解せずにビジネスを指示されることがあります。
これはまあデータを使ったビジネスを考えようとしていると好意的に取ることもできますが、まだまだ経営陣の理解が足りない状況であることがわかります。
DXレポートを拠り所とした経営陣への提言を行い、データ利活用(DX)の実現のためには経営陣の理解が必須ということを提言し、理解してもらうように進めました。
ブラックボックス化した定義にひどくこだわる
「日報」と呼ばれている、レポートは何十年という単位で同じ手順で配信されており、仕様書もなかったため完全にブラックボックスになってました。
改めて定義をして、集計しても何故か数字がずれてしまうような状況でした。
会社側の人が何十年前のCOBOLのコードを解析する難易度を把握できないために、システムに聞けばわかるだろとなかなか理解されません。
こちらは元の日報は何十年という謎の信頼があるため苦戦してますが、昔が正しいというより、今が正しいものであることと古いものがどのようなものかを解析して理解を求めています。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
データマネジメントを学ぶ人が抑えておきたい本
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。
この記事が気に入ったらサポートをしてみませんか?