見出し画像

CA DATA NIGHT #2 〜事業成長への鍵となるデータマネジメントの活用事例〜 レポート

CA DATA NIGHT #2 〜事業成長への鍵となるデータマネジメントの活用事例〜 レポート

AbemaTVでおなじみのサイバーエージェントさんが主催のイベントです。
レポート書きます。

別にいいけど、めっちゃ人募集してそうなオーラを感じました。

データマネジメント セミナーレポート

その他データマネジメント関連のセミナーに興味ある人はこちらから。

Amebaのデータマネジメント戦略:地道な実践と進化の軌跡

発表者

株式会社サイバーエージェント メディア統括本部 Data Science Center / データマネジメント 加藤 寿明

発表資料

(載っていれば後から追加する)

概要

Amebaの事業紹介

アメブロをメインとしたCGMサービス。
専任のデータマネジメントチームが立ち上がっている。
データをキレイにするためにどんなことをやったのかというのを紹介。

データマネジメントの注力すべき観点の決め方

データマネジメントの業務は幅広いのでどうやって、やることを決めていくのか。4つの観点から決めていった。

データ利用者の観点:データ利用者の満足度に直結するところは注力すべき、データセキュリティは後回しに仕様。
DMBOKの成熟度観点:独自に成熟度を作って計測、低いところは注力すべき。
組織的な観点:組織的に課題になっている所を注力すべき
Peter Aiken フレームワークの観点:土台から順に注力すべき

データ基盤の取り組み

便利なものが使われていき、ジョブの設定やクエリが個人管理になっているなど、ガバナンスが取れなくなっていった。その結果、結果が担保されないなど課題が起きていった。

ツールとルールを整備して、利用者に普及することで対応していく事に。

1.内製の新バッチシステムへ統合していった
2.ジョブの氾濫を防ぐために運用ルールを整備
3.データ利用者への布教

ツールとルールを整備したところで、守られなければ意味がない。
布教活動を頑張った、説明とドキュメンテーションを繰り返し行った。
ある程度上手くいきそうなタイミングで、移行作業を実施。ここは気合で頑張る。(ヒアリング→いるいら判断→移行の繰り返し)

結果どうなったか

利便性や管理性が上がって、コストカット。
対応工数や難易度UPはトレードオフとして我慢した。

成熟度も上がって、来期に向けてあげる準備ができた。
データマネジメントの取り組みは地味だけど、与える価値は地味じゃない事が効果として生まれた。

感想

サイバーエージェントというIT企業でも荒れちゃうのかみたいな。

オンプレのHiveとか、古き良き技術があればあるほどモダンな環境に移行できないのは、普通のアプリケーションについても同じなので、同じ状況なんだろうな。

昔金融会社で汎用機&COBOLの環境をAWS&JAVAの環境に乗せ換えるプロジェクトを横から見ていたことがあるが、古いがゆえにどうなっているのか紐解きながら移行しないといけなくてめちゃくちゃ大変そうだった。

新しく金融事業を起こしてシステムを作ったらどんだけ楽なんだろうかと思ったので、古い技術が残っているというのは移行するのが相当難しい。

何やるにしても。まずは統制を取りに行くというのは良い打ち手だと思う。

質疑

サービスにとってどういう影響を与えた?
データ統合に限ったことじゃないですが、今まで見えないデータが見えた、品質も上がって良かった。

参照元のテーブルは開発側の都合で変わると思うけど、そういう時にビジネス側が作ったジョブに影響あると思うが、どういう連携をとってますか?
開発側の影響で変わるよりも、GCPのリージョンを変えたことで影響が大きかったが、Auditlogを見て利用者を特定した。

成熟度ってどういうところをカスタマイズしましたか?
セッション3を期待ください。

オンプレのHiveをやめてBigQueryに統一する選択は無かったの?
それをするにはいろんなことを解決しなきゃいけないので、まずはここを移行した。将来的にはやるかもしれません。

マネジメントの進化のグラフ、ドキュメントが低めなのはどういう理由?
部分的には上がっているが、我々が評価しようとしている観点に達していなかったから。進化はしている。

ABEMAデータマネジメント その難しさとおもしろさ

発表者

株式会社AbemaTV 開発本部 Abema DataCenter / データマネジメント 田中 聡太郎

発表資料

(載っていれば後から追加する)

概要

大規模プロダクト・組織のデータマネジメントの難しさ

ここの章は前回書いたので浅めに。

ステークホルダーが多くて大変、負荷を下げていく事は可視化・標準化と委譲が大事。

データが共通言語になっていないと、非効率な議論に陥る。

「視聴」というドメイン・概念の捉え難さ・おもしろさ

視聴ってPVとは違う考え方があって面白い。

動画なので、動画が流れると視聴に従って動画が経過していく、そしてシークバーを使えば見たいところにスキップできる。
そういう時にどういうデータを取れば役に立つデータが取得できるのか。
意味のある視聴というのはどういう物なのか。

視聴データをどうデータモデリングしていくか。Abemaは自社コンテンツとして動画を持っているのでそれを考えることができて非常に面白い。

さあ、考えてみましょう!

Abemaのデータマネジメントはどんな人が楽しめる環境か

今までは地盤的な所に注力していたので、今後はやっとデータモデリングに着手することができるようになってきた。

感想

可視化・標準化と委譲がキーワードとして合ったが、エンジニアからPM職、マネージャー職になった時に、管理とガバナンスは得意分野になったのでデータマネジメントは自分に合っているなとひしひしと思った。

データを共通言語にしないとコミュニケーションコストが高いという話で、意味の定義を例に出していたが、そもそもKKDじゃなくて数字で語ろうぜレベルで共通言語にしないと大変なんだよなぁみたいな。

動画のデータをどう取得してどう保持するのかというのは確かに面白いなと思った、なんか考えてみよう。Abemaさんに聞いてみよう。

アニメの動画データを取って、グッズが売れるかどうかをわかるようになりたいな。

質問

データに関する質問を全部受けていたら時間が無くなるということで、どれくらい手間かかる?
結局メタデータかドキュメントを作らないと属人的になっちゃうので意識的に取り組んでいる。

ロジックの確認は大変なのでは?工夫している点があれば。
結構苦戦しているが、意識していることはデータを使いたい人の中でもいろんな職種やリテラシーの人がいる。だれ向けの情報かを意識してドキュメンテーションしている。

組織KPIと事業成果はどうなりましたか?
KPIと事業への成果の関連性は示せていない。組織KPIとしては情報鮮度と充実度のカバレッジをKPIとしている。満たした後は次は参照者と参照率がKPIになると思っている。

データアーキテクチャに手を入れる前にADRを登録しているということだが、どのように使われてますか?
データアーキテクチャは存在していたが8年という歴史があるので、データパイプラインも変わっていっている。ADRを導入することで8年の変遷を記録することができる。
ADRを入れる上で現状を可視化して、今後の意思決定を記録できるようにしたのは価値となっている。

データ活用で事業貢献するためのデータマネジメント立ち上げ

発表者

株式会社サイバーエージェント メディア統括本部 Data Science Center / データサイエンティスト 鈴木 元也

発表資料

(載っていれば後から追加する)

概要

データ活用と事業貢献

データ活用が事業貢献につながっているのかというと、なかなか答えるのが難しい。事業貢献するための考え方について話します。

サービス状態で求められるデータ活用の考え方

プロダクトラフサイクルの時期によって、求められるデータ活用が変わってくる。
例えば、導入期には使うためにデータもたまっていないのでまずは貯めることからスタートしないといけない。

成長期~成熟期になるとデータ活用ができるが、世の中そんなサービスは多くないため、限られた環境の中でも成果を出す必要がある。

成熟期のデータ活用(アメブロの例)

データ活用に関わるステークホルダーは多職種に渡るが、職種によって持つ課題は違う。

大きく分けると戦略、活用、蓄積の3つに分類できる。
今回は蓄積に関することをテーマとします。

データマネジメントチームの立上げステップ

1.事業責任者に増員を認めてもらう

成熟したサービスでは簡単に増員できない。増員したいと言っても妥当性がある説明が必要。なかなか大きな壁となっている。

課題としては事業責任者にはコスト以外の主張が理解されずらい事だが、事業責任者側ではなく、データ職が説明することをあきらめているからではないか。
そこに気が付いたので、あきらめずに説明した結果、増員が認められました。

2.リクルーティングしてチームを立ち上げる。

増員は認められたもの、データ環境は煩雑という状況。
データマネジメントに取り組んでいる人はいなかった。
あきらめずに社内の認識を変えてもらうように説明しました。

応募するポジションと過去の経験はバラバラなことも多いので、データエンジニア/データマネジメントに興味が無いかを聞いたけっか、人材を獲得できた。

3.データマネジメント成熟度

やることは無限にあるが、やることに注力するだけではなく、やった結果どうなるのかを定期的に見直して必要性を示していった。

DMBOKの指標はあいまいだったので、納得感をもって評価するためにCAの組織で持っていた基準を使った。
成熟度を定めるための試行錯誤は多くあり、バージョン10で正式版ができた。

知識領域×データフロー(各種層)に対して、7つの観点(情報公開、情報理解、再現性、責任の所在、ニーズ、育成、技術)と5つのレベルをもって評価した。

これからのデータ職は環境を作れることも重要になってくるだろう。

感想

良い環境を作るために組織を作っていくというのは、自分もやっているのですごくわかる。

自分的には責任者に話を通すためには、正しい説明と共に人とやる気が大事だと思っているので、データマネジメント担当者である自分が領域こだわらず成果を出すと信頼を得て進められるという実感がある。

リクルーティングはめっちゃムズイのでどこの会社も苦労しているのだろうなと聞いていて思った。

成熟度、ちゃんと定義しすぎて図るのが大変そうというのが所感。マジで狂気のレベル。

質問

進めるにあたっての苦難があったと思うが、印象に残っているのは?
スタート地点が0人だった、スタート時点は人がいて人がいなくなったのは辛かった。

人を増やすための工夫は?
データマネジメントに対してネガティブな印象を持つ人が多くいると感じていたので、そこを変えていく事を頑張った。

アセスメントするためのマンパワーは?
期間としては今年の3月がスタートで1~2か月くらいかかった。

環境を作るためにやったことは?
ドキュメントは影で頑張ってました。

おわりに

自分の知識をまとめるためと今後誰かがデータマネジメントをやってみたいと思った時のきっかけとなるためにnoteを書くことにしました。
モチベーションのために役にたったという人はぜひ、フォロー&スキをお願いします。
ツイッター(@yoshimura_datam)でもデータマネジメントに係る情報をつぶやいてますので、よろしくお願いします。

データマネジメントを学ぶ人が抑えておきたい本

今すぐわかるデータマネジメントの進め方
著者のDMBOKを用いてCDO室を立ち上げデータマネジメントを推進した経験を基にデータマネジメントの進め方をまとめたkindle本を執筆しました。

データ組織立ち上げ編 AI事務員宮西さん
著者のデータ組織の立ち上げ経験をマンガ+コメントでまとめてみました。立ち上げ編は組織を立ち上げてやることが決まるまでのストーリーです。
無料公開のため0円となります。
データ組織の立ち上げに関係する方は是非読んでみてください。

DXを成功に導くデータマネジメント
DXを成し遂げるために必要なデータをどうマネジメントしていけばよいかが書かれている。
データ環境より、セキュリティの観点であったり、プライバシーの観点であったりといった非技術者向けの内容が多く書かれている。
データマネージメントに興味を持った人はまずは読んでみるとデータマネジメントでなすべき概要が理解できる。

実践的データ基盤への処方箋
データ利活用を行うために必要なデータ基盤の考え方と、利活用するためにはデータをどのようにマネジメントしていけば良いかを具体的な例を用いて説明されている。
技術が中心になるので現在データ技術に係る人がデータマネージメントに興味を持った時には、まず手に取ることをおすすめする。

個人データ戦略活用 ステップでわかる改正個人情報保護法実務ガイドブック
個人情報保護法を順守するための基本的な考え方が実務ベースで書かれている。2022年4月に施工される改正個人情報保護法で新たに追加される概念も同様に記載されている。
政府の出しているガイドラインよりも俯瞰的に読めるためデータプライバシーにかかわる人、データを使ったビジネスを推進する人は読んでおくとスムーズに業務が進められる。

データマネジメント知識体系ガイド(DMBOK)
自分も要約・解説記事を書いているDMBOK。データマネジメントに興味を持った人がまず手に取ると挫折することは間違いないほどのボリュームがある。
読めば読むほど味が出てくるので、データマネジメントを進めようとしている人は各家庭に1冊は是非買っておきたい。

データマネジメントが30分でわかる本
著者もDMBOKを読むためには非常にボリュームが多く読み解くには苦労するので、かみ砕いた解説書をまとめたと書いてある通り、DMBOKを独自解釈してわかりやすく書かれている。
DMBOKを技術者目線で読み解いた内容になっているので、実践的データ基盤への処方箋と同様データ技術に係る人におすすめする。

この記事が気に入ったらサポートをしてみませんか?