見出し画像

JDMC特別講座「データマネジメントの基礎と価値」 データガバナンス

JDMCと「データマネジメントの基礎と価値」の講座について

日本データマネジメントコンソーシアムというデータマネジメントを研究している団体で、日本には同じような団体としてDAMAがある。

その中にいろいろな研究会があり、この講座はそのなかの一つ「データマネジメントの基礎と価値」研究会よりデータガバナンスについての動画が公開されたので感想を交えつつ、まとめる。

2020年11月24日に横浜国立大学の特別講義として行われたもの。

詳しくはこちらへ

データマネジメント セミナーレポート

データマネジメント関連のセミナーに興味ある人はこちらからどうぞ。

データガバナンスとは

DAMAが発行しているデータマネージメントの知識体系書DMBOKによると、各領域の中央に属するもので、それぞれの軸を管理監督すべきであるという考え方。

ただし、ガバナンスというものをデータのリスク管理ととらえることもあり、今回の講義では「2」を話していると思われる。

画像1


本日の口座のサマリ

データってどんなもの?

解釈のもとになる原材料

データを活用することは、どういうこと?

データをもとに判断を行い、メリットを得ること

データを活用するためには何が大事

ガバナンスを効かせ、適切に管理すること

皆さんの身の回りで活用できるデータとは何ですか?

Society5.0で書かれているように、生活に根付いている様々なことで使われている。

データを活用する上で注意しないといけないことは何ですか?

データを正しく扱うために、データガバナンスを効かせる必要があり、取り扱いに注意する必要がある

データに関連した最近の出来事

事例1
横浜市の水道局が19年間ご請求をしてしまっていた。
2階の世帯と3階の世帯と逆に請求をしてしまっていた。

この事例で一番ダメなところは、19年間気が付けなかったこと。
ミスは起こりうるので、正しくチェックできるようにするような体制を整えることが重要。

事例2
リクルートキャリア社が内定辞退率を38社に販売していた。
それが、就活生からの十分な同意がなく販売していた。

企業側にとっては必要なデータだった。
データから算出されたスコアで就活生に不利な影響が及ぼされる恐れがでてしまった。
そもそも、同意を得ない利用は個人情報保護法観点でNG。

事例3
新型コロナウイルスの感染者数について8つの自治体が国とは違う基準で集計して発表していた。

何が正しい数値なのかわからなくなってしまい、それを合算することで何がほんとのものなのかわからなくなってしまう。統率が取れていない。
早く行うことを優先したため、データとして意味がないものになってしまい、データ自身の価値や信頼性が低下してしまった。

事例4
ユニクロのIFIDタグを使ってレジの生産時間の短縮化をした。
倉庫→輸送→店舗までの流れを可視化している。

顧客から見ればレジの短縮化だけだが、分断されがちな各々の個品管理をIFIDをつけて管理することで一連の流れをすべて可視化して管理することができている。

一方で、RFIDが正しく取り付けられているかという、リスクの管理をすることは必要である。

データの基本

データとはなんでしょうか?

Wikipedia
データとは、情報を表現するもので形式化され再度情報として解釈できるもの。
(なぜ、Wikipediaを引用するのだろうか・・・?)

データ活用のフレームワークDIKWの紹介

画像2

データは生まれて消えるもの

データにも登録されて消去されるまで、各ステージが存在する

データライフサイクル
登録→保存→利用→共有→長期保存→破棄

企業は、大多数のデータを長期保存する。そのためシステムが変わるタイミングでデータ移行が行われる。

データの種類

社会の進化に合わせてデータ活用が広がると主に、データ活用で、取り扱うデータの種類も飛躍的に拡大している。

なぜ、データに注目するのか

データはヒト・モノ・カネに続く第4の経営資源。

Society5.0と定義された社会を実現するために必要なものがデータ活用である。

画像3

ちなみに、データは新しい石油であると語られることがあるが、実は原油のほうが表現として正しいという話。


データに関する法令制度

データを活用するときは、法令制度や社会ルールを守ることが大事。

・知的財産権
・AI規制(米国)
・GDPR(EU)
・独占禁止法
・契約による縛り

GDPRは日本で事業を行っていても、EUからのアクセスについては対応しないといけないので大変。

データマネジメント活動とは?

データマネジメントとは「データをビジネスに生かすことができる状態を維持し、さらに進化させていくための組織的な営み」である。

DMBOKでも代替同じようなことが書かれていて、データを資産として管理するというのがDMBOKだった記憶がある。

JDMCは①~③でデータマネジメントを定義している。

①目的に合った品質を備えたデータ
②データ利活用基盤と取り組み
③データガバナンス

①目的に合った品質を備えたデータ

データがたくさんあったからと言って、活用できない。
データの品質が要求されたレベルを満たしている必要がある。精度、鮮度、粒度によって評価できる。
ビジネス目的によって、尺度が変わってくるためビジネス目的が重要。

精度:あきらかにおかしなデータが入っている
鮮度:なかなか更新されない
粒度:集計単位がシステムによって違っている

データを説明するデータを「メタデータ」と言う。データの説明書。

ちなみに、DMBOKでは、データ品質を「そのデータでビジネスの目的を達成できるかどうか」と定めている。

②データ利活用基盤と取り組み

人が行うこと、システムが行うことを合わせて基盤

基盤:連携、収集、格納、蓄積、加工、提供、クレンジング
ガバナンス:ルール、チェック、教育

③データガバナンス

データを正しく扱い、データ利活用を進めていくこと。

データガバナンス・基本のチェック

データガバナンスのゴール
「組織がデータを資産としてマネジメントできるようにすること」

(立法)守るべきものを制定:法令、ポリシー
(行政)守らせるための仕組み:プロセス、ルール
(司法)守られているかをチェック:法律、条令、モラル

それぞれをバランスよくやらないといけない。

メタデータとデータリネージ

メタデータは、図書館の索引に例えられる。データを説明する情報をすべてメタデータといわれる。

データリネージは、データの変遷を指す。どうやってそのデータは生成されたのかということ。

ビックデータ

2025年には2019年の約4倍となる175ゼタバイトに到達するといわれている。

おわりに

自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。

モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。

ツイッターでもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。

データマネジメントを学ぶ人が抑えておきたい本

DXを成功に導くデータマネジメント

DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。

実践的データ基盤への処方箋

データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。

個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック

個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。

データマネジメント知識体系ガイド(DMBOK)

自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。

データマネジメントが30分でわかる本

著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。

この記事が気に入ったらサポートをしてみませんか?