見出し画像

ISOのデータ品質管理の取り組み

データ品質の重要性が指摘される中で 、従来のデータベースやシステム視点のデータ品質管理でなく、もっと大きな視点でのデータ品質管理が求められている。
品質管理というとISO9000を思い浮かべる人がいるだろう。もっとシステム設計に近い人はISO24012を思い浮かべるだろう。でも、最近のデータ品質管理を考えるなら、他の標準も考える必要がある。

ISO9000

ISO9000は、品質マネジメントシステムの標準で、国内で広く普及が進んでおり、認証を取っている企業もおおい。一方で、マネジメントシステムの標準であり、実際の対象物の品質が高いかどうかを保証するものではない。

ISO25000

Systems and software Quality Requirements and Evaluation (SQuaRE)であり、システムやソフトウェアをはじめ、システムの要素であるデータのクオリティについても規定している。

SQuaRE全体構成

ISO25012

ISO/IEC 25012:2008 Software engineering-- Software product Quality Requirements and Evaluation (SQuaRE)-- Data quality modelであり、データ自体の品質の定義をしている。データ品質というと国内で最も多く参照されるモデルである。
データ品質モデル特性として以下を定義している。

正確性(Accuracy)
完全性(Completeness)
一貫性(Consistency)
信憑性(Credibility)
最新性(Currentness)
アクセシビリティ(Accessibility)
標準適合性(Compliance)
機密性(Confidentiality)
効率性(Efficiency)
精度(Precision)
追跡可能性(Traceability)
理解性(Understandability)
可用性(Availability)
移植性(Portability)
回復性(Recoverability)

ISO25012

データ自体の品質の評価をすることができる。

一方、この標準はデータベースを前提としてデータ品質モデル特性を定義しているため、現在のデータ流通を対象としたサービスを考えると適合しないものもある。例えば、移植性や回復性はデータベース固有の問題である。

ISO25024

ISO/IEC 25024:2015 Systems and software engineering-- Systems and software Quality Requirements and Evaluation (SQuaRE)-- Measurement of data qualityであり、データのライフサイクルを通じたデータ品質管理を定義している。

ISO25024全体像

ライフサイクルの各プロセスでデータ品質のチェックをするようにしていることが重要である。
データ設計時に、データが正しく入力、取得できるように設計し、データ収集では、品質チェックしてデータを取り込んでいる。外部データを組み合わせる場合にそのデータの信頼性を調査し、それを統合するといった各フェーズで品質向上の取り組みができるようになっている。

ISO8000

Data qualityについて規定するISO9000の関連標準である。組織間・システム間で情報交換する際のデータ品質要件・品質評価の⽅法やプロセスを定義している。既に多くの規格が作られており各国で導入が始まっている。

ISO8000全体像

ISO8000は、ISOの技術委員会TC184 (Automation systems and integration)/SC4 (Industrial data) のWG13(Industrial Data Quality)で議論されており、産業色が強いが広く他分野のサービスにも適用できる。

まずがボキャブラリ管理が重要でありPart2 でその定義を行っている。

データマネジメントの仕組みはPlanning-Control-Assurance-Improvementのサイクルが定義されており、データに関して強いガバナンスがかかるようになっている。

データ品質マネジメントの構造

また、マスターデータの管理も体系化されている。特にその特性として、プロビナンス(来歴)情報、正確性、完全性が重視されている。

アーキテクチャ設計から運用でのフィードバックまでがフレームワークとして整理されている。

マスターデータ品質管理フレームワーク

ISO19157

Geographic information — Data qualitであり、2013年に制定されている。データ品質を、メジャー、評価、結果、メタクオリティの4要素で定義している。

ISO標準による検証

各ISO標準を組み合わせて評価することで、課題の管理が容易になる。

国の大規模サービスの評価例

今後に向けて

日本のデータ品質管理の取り組みは、個々のデータベースなどミクロの視点で行われることが多かった。しかしデータをめぐる環境が大きく変化し国際的な検討も活発に行われている。日本の貢献に対する期待も大きいことから、今後、ISO8000も含めた国際的なデータ品質管理の枠組みつくりへ積極的に参加していく必要がある。

この記事が気に入ったらサポートをしてみませんか?