見出し画像

DATA SABER Ordeal 0 振り返り

データとはなにか?なぜ必要とされているのか?

「データとはなにか?」

  • データは0と1の集合体に見えるが、実はデータの向こう側にある人の営みや自然現象を表している

  • データは時空を超えて共有でき、過去や現在の出来事を知ることができ

  • データには人々の活動の痕跡が記録されており、人々の行動や思考を理解する鍵となる

「なぜ必要とされているのか?」

  • 業務がデジタル中心に記録されるようになったから

    • デジタル化により大量のデータを扱えるようになり、多様な商品を管理・販売・ビジネスの迅速な展開が可能になった

  • リアル世界の事象もデジタルデータ化が進んでいるから

    • 人の動きや自然現象、生体情報、製品の流通など、あらゆるものがデータ化されている

    • 最近は、リアルとデジタルが双子(ツイン)のように連動するデジタルツインの概念が生まれた

  • データにアクセスする手段が容易になったから

    • クラウドリソースの発達により、誰もが大規模データに即座にアクセスできるようになった

    • ノーコードツールや自然言語インターフェースにより、高度なスキルがなくてもデータを活用できるようになった

データはどこにある?

データの流れ

  1. 買い物などの人のアクションが起こると、それに応じたデータ(Row Data)がシステムから各DBへ集まる

  2. Row Dataを直接編集するのは危険なので、それをそっくりそのままコピーした集まりがデータレイク

  3. そのデータレイクにあるRow Dataを整理し、分析しやすくするためにしたのがDWH(データの倉庫)

  4. DWHにあるデータを特定の用途に合わせて更に整理したものがデータマート(DM)

  5. 分析ユーザーはそのDMからデータを読み取りBIやAIに入力していく

https://www.youtube.com/watch?v=Z0Lt7SVnIco&list=PLR1ulf4cyh2nL5XVdtO0P-kIwpi3AM_Pi&index=3&ab_channel=KT

さらに進化する情報系システムのトレンド

上の各箱の機能をまるっと、1つにしたのが「データクラウド」
製品としてはSnowflakeなど。データ分析基盤として、まるっと集約することで、各DBを横断したデータ分析が可能に。KTさんが動画で仰っていたアクセスの制限も、個人単位ではなくロール単位で権限管理できるのも特徴。

https://www.youtube.com/watch?v=Z0Lt7SVnIco&list=PLR1ulf4cyh2nL5XVdtO0P-kIwpi3AM_Pi&index=3&ab_channel=KT

データを分析する上で

  • お互いに感謝の気持ちを忘れない

    • データを提供してくれている人たちへ感謝しよう

    • データを使っている人のやりたいことを真剣に聞こう

  • データの在処に想いを馳せられるか

    • 知りたいことは何?(WHAT)

    • そのデータはどうやって記録されているか(HOW)

    • 誰の持ち物か(WHOM)

    • いつのデータが欲しいのか(WHEN)

データを理解する集計の力

  • 集計 ≠ 合計

    • 数字を集めて計算する(sum、ave、min、max・・・)

  • データの粒度と集計方法

    • Level of Detail(LOD)

      • 時間・場所・人・モノなど

    • 適切なデータの粒度(詳細レベル)と計算方法を選ぶことで、具体的な洞察が得られる

  • データを理解する集計の力

    • (データの粒度)×(ストーリーテリング)×(集計方法)

データを理解する表現の力

ビジュアル表現とは

二次元のキャンバスに
”相対的に”データの大きさを描き
”比較する”技術
数値としてのデータをただ眺めても、主観的な分析しかできない。
データを相対的に比較することで洞察は得られる。

いかに適切な「場」をセットできるか

データを見るときは、二次元世界に置くものを選ぶ
= 置いてないものは見えない
= 場に置くデータをどれにするか選ぶ力を問われる

この記事が気に入ったらサポートをしてみませんか?