見出し画像

「信頼できる唯一の情報源」とは?分散化した業務システムの問題点【データの信頼性#1】

お疲れ様です。高原巡りをしたいのですが天気と気分のタイミングがなかなか合いません。Shinです。

今日はデータエンジニアリング領域における概念「信頼できる唯一の情報源(Single Source of Truth : SSOT)」についての思考整理です。

信頼できる唯一の情報源:SSOTとは?

SSOTは情報システムにおける設計思想のひとつです。SSOTは、その意味が示す通り「あらゆるデータは単一の場所で発生・編集され、その場所のみを「信頼できる唯一の情報源」とする」という考え方です。

信頼できる唯一の情報源を設けることにより、企業は正確で信頼可能なデータに基づいた意思決定を迅速に行うことができるようになります。

SSOTを考慮しない分散的アーキテクチャの問題点

通常、企業内外では様々なシステムが利用され、データは分散した各業務システムで発生・編集されています。ここでは、それらの分散した各業務システムを源泉システムと呼びます。こうした一般的な分散したアーキテクチャのもとでは、企業活動において発生するデータは各源泉システムで保持されます。(※一旦この時点ではデータ連携は考えないものとします)

次いでデータ分析等をはじめとするデータ活用のために、企業が持つこれらのデータを利用したい場合、源泉システムが分散したアーキテクチャの場合、いくつかの問題が発生します。

一つ目の問題は正確性の担保です。同様のデータが複数の源泉システムで保持されており、どの源泉システムが持つデータが最新で正確な情報か分からなくなることが挙げられます。この問題は、マスタデータ等の複数の源泉システムにおいて必要と考えられるようなデータにおいて該当しやすい問題であると考えられます。

二つ目の問題は一貫性の担保です。一つ目の問題にて述べた通り、同様のデータが分散している場合、データ活用者によってどの源泉システムが持つデータを分析対象として採用するかに差異が生じます。分析対象が同様のデータであったとしても、どの源泉システムが保持するデータを採用したかによって分析結果は変動します。従って、これらの状況におけるデータ活用は一貫性がなく信頼に堪えうる結果を導くことができません。

三つ目の問題は探索性の確保です。つまりスピードです。あるデータを分析したい場合、源泉システム及び保持するデータが散在していると、どこに何のデータがあるのかを探すところから始める必要があります。このデータ探索における手間と時間は、データ分析のスピードを遅らせる原因になります。

上記に挙げた問題は、企業のデータ活用を阻害する要因となります。例えば、正確性と一貫性がないために可視化された経営情報は信頼されるに足りず、データに基づいた正確な意思決定ができなくなる恐れがあります。探索性が悪ければ、ITリテラシーが浅い現場部門での自主的なデータ活用がなかなか進まず、現場部門からデータ分析を依頼される情報システム部門の負担はいつまで経っても減りません。

おわりに

以上、SSOTの概要と分散的な業務システム群のアーキテクチャにおける問題を整理しました。

これらの問題を解消する「信頼できる唯一の情報源」を設けることによって、データの正確性の検証や探索の手間を削減し、正確かつ一貫性ある精度の高い分析を行い、迅速な意思決定を実現することが期待されます。

次回、SSOTを実現するための具体的な方法について触れたいと思います。

最後までお読みいただきありがとうございました。

この記事が気に入ったらサポートをしてみませんか?