ISOのデータ品質管理の取り組み
データ品質の重要性が指摘される中で 、従来のデータベースやシステム視点のデータ品質管理でなく、もっと大きな視点でのデータ品質管理が求められている。
品質管理というとISO9000を思い浮かべる人がいるだろう。もっとシステム設計に近い人はISO24012を思い浮かべるだろう。でも、最近のデータ品質管理を考えるなら、他の標準も考える必要がある。
ISO9000
ISO9000は、品質マネジメントシステムの標準で、国内で広く普及が進んでおり、認証を取っている企業もおおい。一方で、マネジメントシステムの標準であり、実際の対象物の品質が高いかどうかを保証するものではない。
ISO25000
Systems and software Quality Requirements and Evaluation (SQuaRE)であり、システムやソフトウェアをはじめ、システムの要素であるデータのクオリティについても規定している。
ISO25012
ISO/IEC 25012:2008 Software engineering-- Software product Quality Requirements and Evaluation (SQuaRE)-- Data quality modelであり、データ自体の品質の定義をしている。データ品質というと国内で最も多く参照されるモデルである。
データ品質モデル特性として以下を定義している。
データ自体の品質の評価をすることができる。
一方、この標準はデータベースを前提としてデータ品質モデル特性を定義しているため、現在のデータ流通を対象としたサービスを考えると適合しないものもある。例えば、移植性や回復性はデータベース固有の問題である。
ISO25024
ISO/IEC 25024:2015 Systems and software engineering-- Systems and software Quality Requirements and Evaluation (SQuaRE)-- Measurement of data qualityであり、データのライフサイクルを通じたデータ品質管理を定義している。
ライフサイクルの各プロセスでデータ品質のチェックをするようにしていることが重要である。
データ設計時に、データが正しく入力、取得できるように設計し、データ収集では、品質チェックしてデータを取り込んでいる。外部データを組み合わせる場合にそのデータの信頼性を調査し、それを統合するといった各フェーズで品質向上の取り組みができるようになっている。
ISO8000
Data qualityについて規定するISO9000の関連標準である。組織間・システム間で情報交換する際のデータ品質要件・品質評価の⽅法やプロセスを定義している。既に多くの規格が作られており各国で導入が始まっている。
ISO8000は、ISOの技術委員会TC184 (Automation systems and integration)/SC4 (Industrial data) のWG13(Industrial Data Quality)で議論されており、産業色が強いが広く他分野のサービスにも適用できる。
まずがボキャブラリ管理が重要でありPart2 でその定義を行っている。
データマネジメントの仕組みはPlanning-Control-Assurance-Improvementのサイクルが定義されており、データに関して強いガバナンスがかかるようになっている。
また、マスターデータの管理も体系化されている。特にその特性として、プロビナンス(来歴)情報、正確性、完全性が重視されている。
アーキテクチャ設計から運用でのフィードバックまでがフレームワークとして整理されている。
ISO19157
Geographic information — Data qualitであり、2013年に制定されている。データ品質を、メジャー、評価、結果、メタクオリティの4要素で定義している。
ISO標準による検証
各ISO標準を組み合わせて評価することで、課題の管理が容易になる。
今後に向けて
日本のデータ品質管理の取り組みは、個々のデータベースなどミクロの視点で行われることが多かった。しかしデータをめぐる環境が大きく変化し国際的な検討も活発に行われている。日本の貢献に対する期待も大きいことから、今後、ISO8000も含めた国際的なデータ品質管理の枠組みつくりへ積極的に参加していく必要がある。
この記事が気に入ったらサポートをしてみませんか?