![見出し画像](https://assets.st-note.com/production/uploads/images/140362426/rectangle_large_type_2_262246c3a7918c394e4cc22f31a73a22.png?width=800)
DATA SABER Ordeal 0 振り返り
データとはなにか?なぜ必要とされているのか?
「データとはなにか?」
データは0と1の集合体に見えるが、実はデータの向こう側にある人の営みや自然現象を表している
データは時空を超えて共有でき、過去や現在の出来事を知ることができ
データには人々の活動の痕跡が記録されており、人々の行動や思考を理解する鍵となる
「なぜ必要とされているのか?」
業務がデジタル中心に記録されるようになったから
デジタル化により大量のデータを扱えるようになり、多様な商品を管理・販売・ビジネスの迅速な展開が可能になった
リアル世界の事象もデジタルデータ化が進んでいるから
人の動きや自然現象、生体情報、製品の流通など、あらゆるものがデータ化されている
最近は、リアルとデジタルが双子(ツイン)のように連動するデジタルツインの概念が生まれた
データにアクセスする手段が容易になったから
クラウドリソースの発達により、誰もが大規模データに即座にアクセスできるようになった
ノーコードツールや自然言語インターフェースにより、高度なスキルがなくてもデータを活用できるようになった
データはどこにある?
データの流れ
買い物などの人のアクションが起こると、それに応じたデータ(Row Data)がシステムから各DBへ集まる
Row Dataを直接編集するのは危険なので、それをそっくりそのままコピーした集まりがデータレイク
そのデータレイクにあるRow Dataを整理し、分析しやすくするためにしたのがDWH(データの倉庫)
DWHにあるデータを特定の用途に合わせて更に整理したものがデータマート(DM)
分析ユーザーはそのDMからデータを読み取りBIやAIに入力していく
![](https://assets.st-note.com/img/1715498641445-nxifZscJtF.png?width=800)
さらに進化する情報系システムのトレンド
上の各箱の機能をまるっと、1つにしたのが「データクラウド」
製品としてはSnowflakeなど。データ分析基盤として、まるっと集約することで、各DBを横断したデータ分析が可能に。KTさんが動画で仰っていたアクセスの制限も、個人単位ではなくロール単位で権限管理できるのも特徴。
![](https://assets.st-note.com/img/1715499926567-soioff5Ql0.png?width=800)
データを分析する上で
お互いに感謝の気持ちを忘れない
データを提供してくれている人たちへ感謝しよう
データを使っている人のやりたいことを真剣に聞こう
データの在処に想いを馳せられるか
知りたいことは何?(WHAT)
そのデータはどうやって記録されているか(HOW)
誰の持ち物か(WHOM)
いつのデータが欲しいのか(WHEN)
データを理解する集計の力
集計 ≠ 合計
数字を集めて計算する(sum、ave、min、max・・・)
データの粒度と集計方法
Level of Detail(LOD)
時間・場所・人・モノなど
適切なデータの粒度(詳細レベル)と計算方法を選ぶことで、具体的な洞察が得られる
データを理解する集計の力
(データの粒度)×(ストーリーテリング)×(集計方法)
データを理解する表現の力
ビジュアル表現とは
二次元のキャンバスに
”相対的に”データの大きさを描き
”比較する”技術
数値としてのデータをただ眺めても、主観的な分析しかできない。
データを相対的に比較することで洞察は得られる。
いかに適切な「場」をセットできるか
データを見るときは、二次元世界に置くものを選ぶ
= 置いてないものは見えない
= 場に置くデータをどれにするか選ぶ力を問われる
この記事が気に入ったらサポートをしてみませんか?