見出し画像

エンタープライズデータの性質

デジタルトランスフォーメーション(DX)の重要な要素

デジタル技術を用いて企業の事業改革を行う活動をDXと呼び、成功に至る方法論が様々あるが、共通していることは「データ利活用」の重要性だ。そして、「データエンジニアリング」と「データアナリシス」がそれを実現する必要条件となる。

安宅和人氏の『シン・ニホン』では、AI-Ready(デジタル革新)な人材のスキルセットとして、「ビジネス力、データサイエンス力、データエンジニアリング力」の3つを定義しており、日本再生の要諦であるようだ。では、この「データ」とは具体的にはどういったものを指すのだろうか。

自社で流通しているデータの把握

企業のデータは様々な種類・性質のものが混在しており、データライフサイクル(データ生成 -> 保管 -> 活用 -> アーカイブまたは破棄)も一様では無い。また、その事業やサービスにおいて求められるデータとは何かについても多様である。自社にあるこれらのデータを正確に捉え、新しい事業やサービスの企画、運営に有機的に連携させられる事がその企業の差別化要因となる。流通しているデータにはどのようなものであるのかを理解する必要がある。

データの種類とその利用方法

企業には大きく5つの種類のデータがあり、データの品質や性質において違いがある。一つずつ見ていこう。

まずは、「マスタデータ」である。これは、システム処理を実施する上で参照される基礎情報となるものだ。具体的には、顧客マスタ、商品マスタ、在庫マスタなどだ。(在庫データをマスタデータと定義することに反対意見もある)

次に「トランザクションデータ」である。これは、マスタデータを参照して、特定の業務ルールに基づいて処理された(生成された)データ群だ。具体的には、売上データ、購買データや支払いデータなどだ。

3つ目は「法定開示データ」である。基本的にはトランザクションデータをもとに会計仕訳を行い、上場企業であれば財務諸表データとして公に開示される類のものだ。

4つ目は「イベントデータ」である。これは顧客とするユーザの行動履歴やその解析に用いられる関連データの総称である。具体的には、ECカートへの商品投入、アプリダウンロード、来店履歴、サポート問い合わせ、フォロー数など様々なだ。

最後に「アナリティクスデータ」である。これは、イベントデータを元に統計学手法などを用いて「分析による解釈」を付与した二次加工データのことを指す。売上予測分析、RFM分析など、これも多数ある。

それぞれのデータに求められることの違いも理解しておく必要がある。マスタデータの場合は、データの役割上、そのデータ品質に不安があってはいけない。
また、法定開示データは、情報開示の手続きについてルールがあり、このデータ品質が問題だと株式市場・投資市場での企業評価に関わり、場合によっては制裁を課されることにもなる。
しかし一方で、イベントデータやアナリティクスデータに求められることは異なる。それらをまとめたのが以下の表である。

画像1

なお補足すると、これらの話はいわゆる「ビジネスメトリクス」の領域のものであり、「システムメトリクス」と呼ばれる領域(システムログや監視ログ、システムリソース消費データ等)のデータについては考慮していない。

データ設計で必要なシンタックスとセマンティクス

データを理解するべき観点の一つとして、特にデータ設計をする際には欠かせないものが、シンタックス(データの形式や構造)セマンティクス(データの意味)だ。

シンタックスは、例えば80バイトのASCIIコードによるデータのやり取りを行なう、と形式を決めるなどを指す。セマンティクスは、データの意味の定義である。例えば、Aさんが言う「今月の売り上げ」は、Bさんの言う「この期間の注文」と意味が同じなのか、またそれぞれが言う「顧客」は、同じ人たちを指しているのか、などだ。

生み出されるデータの性質や役割はデータの種類に応じて変わるし、データが意味することについての解釈が関係者で一致しているのかどうかも不安定になりうる為、エンタープライズデータを用いた意思決定をする際には気をつけながらデータリテラシーを高めていこう。

この記事が気に入ったらサポートをしてみませんか?