見出し画像

DSBにチャレンジ4 Master KTさんの『データドリブンの極意』を読んでみた。そのサン(DAY4とDAY5)

ただいま、理由あってDATA SABERにチャレンジ中です。で、DATA SABERに認定されるためには、導く力の証であるコミュニティ活動の一環として、Tableau関連のブログ記事の投稿が求められており、こうして書いている次第です。

今回は、このDATA SABERの生みの親である、Master KTさんの『データドリブンの極意』を読んでみましたので、その内容を3回に分けてご紹介します。

で、今回はその三回目ということで、DAY4のデータとは何かとDAY5のデータドリブン文化をさらに広めるためにをご紹介します。

先ず、データとは何かですが、Ordとしては該当するものがないかなと思いました。
データの語源やそもそもデータとはどういうものを指すのかなど、知識発見的な話から始まって、データを取り巻くシステム的な要件、仕様のお話として、ETLからELTへと流れがかわったこと、インメモリデータベースなど、データを高速に処理できるようになってきていること、DWHからデータレイク、また、データレイクハウスのようなプロダクトも出てきていること、データのフォーマットととして正規化のお話や構造化、半構造化データなど、扱うデータの種類が増えていることなど、それらデータを効率的に処理するためにはデータのカーディナリティー(粒度)に気を配ることなど、際限なく広がるデータの海でおぼれないようするために、身につけなければならないスキルや知識はまだまだ増えるよということを伝えてくれています。

この辺りはとりあえず、理解して覚えるしかないという身もふたもないですが、データドリブン文化を推進する役回りに就くのであれば、避けて通れないリテラシーかなと思います。

で、情報系プラットフォーム、データ分析基盤に求められる要件としては、次の2つであると師匠は言っています。

①使用者がデータを使ってインサイトを得られるしくみである。
②ビジネスクリティカルである基幹系システムのデータ入力を絶対に邪魔しない。

①はアドホックにデータへ触れるだけでなく、データリネージュの機能も持って時系列にデータを長期間格納できるような設計になっているか。また、データ量がふえてもシステムのパフォーマンスは維持できるか。あるいは、ユーザが探索的にデータをハンドリングするだけでは不十分で、システム側からのサジェスチョンするような仕組みになっているかなど、全部を満たそうとするとかなり重量級な基盤になりそうです。

②は基幹系システムとはセパレートして構築、運用すれば解決しますが、こちらも①と同様にコスト面で見合うバリューが出せるか、ポイントになると思います。ROIが計算できないシステムに潤沢に資金をつぎ込む企業はいないでしょうから。

そして、最後のデータドリブン文化をさらに広めるためにですが、ここでは、仲間づくり、コミュニティをいかに活性化していくかということについて触れています。そして、組織がデータドリブンな状態になるということは、これってデータドリブンだよねと誰もが言うような状態をさすのではなく、誰もそんなことをいわないけれども、誰もが普段使いでデータを駆使して業務の意思決定を行っている状態を指すんだよと伝えてくれています。

全く持ってそうだと思います。DX(デジタルトランスフォーメーション)も同じだと思うんですよね。これってDXだよねなどと話をしているうちは本当の意味でのDXは推進されていなくて、気が付いたら、仕事のやり方も中身もすっかり変わっていたという状態こそ、真にDXできましたということなので、データドリブン文化についても、その言葉を言っているうちはまだまだだなと思います。

ということで、駆け足でしたが、なんとか400頁弱の大作を読み切りました。DATA SABERへ挑戦している方であれば、ぜひ一度目を通されることをお勧めします。

おわり。

この記事が気に入ったらサポートをしてみませんか?