メタデータとは【データ用語解説】
データ用語解説の趣旨
データに係る仕事をしていて、まだまだデータ利活用に関する用語を誤解していることが多いなと感じています。
という事で、データ利活用に係るデータサイエンティスト、データエンジニア、ビジネス部門、業務部門の人たちが押さえておきたい用語を解説していきます。
今回は「メタデータ」について解説します。
DMBOKベースでメタデータ管理について学びたい人はこちらをどうぞ。
データマネジメントについての情報
データ用語解説
データ用語の解説を書いてます。
今すぐわかるデータマネジメントの進め方
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。
メタデータとは
メタデータとはデータに関するデータという意味。
データに関するデータというのは表現としてわかりづらいので、少し補足すると以下のような説明がよい。
「ビジネスに必要なデータに関する周辺情報」
ビジネスに必要なデータはそれだけでは本来持つ価値を10%も活かすことができない。
周辺情報を正しく管理することで本来持つ価値を100%活かすことができる。
メタデータを管理する意味
データとはそれ単体で見るとただの事実なので、活用する事は難しく、メタデータがあることで100%活かすことができると説明したのは前述の通り。
集めたメタデータはビジネスで活用しやすいように管理する事で本来の力を発揮する。
メタデータの管理は大きく分けて2つ実施することがある。
網羅的に欠損なく集めるという収集に関する点と、集めたメタデータを探しやすくするという点だ。この2点について説明をする。
メタデータを集める
メタデータにはテクニカルメタデータとオペレーショナルメタデータとビジネスメタデータがある。
テクニカルメタデータとオペレーショナルメタデータはシステムに起因するメタデータなので、メタデータ管理ツールと接続し自動的に収集するとよい。
下手に手動で収集すると、実際システム上で稼働する状態と管理上の状態の整合性を取るためのコストが高くなりすぎてオススメできない。
ビジネスメタデータはドメイン知識と呼ばれるその業務に起因する知識なので、どうしても収集は手動にならざるを得ない。
ドメイン知識を持つ人にデータスチュワードとなってもらいビジネスメタデータを収集するとよい。
ただし、実際のところドメイン知識を持つ人に協力してもらうためにはメタデータの有益性の理解、現業務の負荷を考慮しながら進める必要があり難易度は高い。
メタデータを探しやすくする
メタデータを集めただけでは使えないので集めたメタデータを探しやすくする必要がある。
最近は代替手段があるが、インターネットにおけるgoogleが生み出した価値を考えれば探しやすくする事がいかに重要かが分かるだろう。
メタデータ管理ツールはテクニカルメタデータを自動的に収集する機能以外に集めたメタデータを探せる機能を持っている。
検索機能が優れているというのも重要だが、分析ツールとシームレスに連携できるというのが一番使われるキーになる。
メタデータのデータマネジメントをするときは利用者の導線をヒアリングして業務フローに最適な連携を取ると良い。
メタデータ管理の解説動画
メタデータ管理のゆっくり解説動画を作ったので、こちらもよろしくお願いします。
おわりに
自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。
データマネジメントを学ぶ人が抑えておきたい本
今すぐわかるデータマネジメントの進め方
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。
データ組織立ち上げ編 AI事務員宮西さん
著者のデータ組織の立ち上げ経験をマンガ+コメントでまとめてみました。立ち上げ編は組織を立ち上げてやることが決まるまでのストーリーです。
無料公開のため0円となります。
データ組織の立ち上げに関係する方は是非読んでみてください。
DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。
実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。
個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。
データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。
データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。
この記事が気に入ったらサポートをしてみませんか?