4つの属性でデータを見る目が変わる
大量のデータを前にしたとします。あなたはこれらのデータにどのようにアプローチしていくでしょう。
多くの人はデータの量や数値の大きさに注目するのではないでしょうか。グラフなどを作成したとしても表面的な読み取りに留まってしまっていないでしょうか。
これだけではデータの本質を見落としてしまっている可能性があります。
データ分析の世界の4つの属性
データ分析の世界では、情報を「4W」で分類する方法があります。
When (いつ):時間
Who (誰が):人
Where (どこで):場所
What (何を):物
これら4つの属性は、シンプルながらも複雑なデータを理解していく上で足掛かりとなるフレームワークなのです。
4つの属性からデータセット全体を把握し、どのような情報を含んでいるかを多角的に知ることができます。これによって、データの背後にある物語を読み解くことに繋がるのです。
例:出版社の書籍売上データで考えてみる
When (いつ): 売上データの日付・期間、発売日、売上推移など
Who (誰が): 顧客情報、年齢、性別、職業、特定の作家、シリーズなど
Where (どこで): 売れた場所、地域、店舗、オンライン、イベントなど
What (何を): 売れた本、ジャンル、紙か電子化、タイトル、著者など
注意
売上部数、利益率などは、データの [属性 (ディメンション)]ではなく、データの [数値 (メジャー)]。データの [数値] を [属性] の方向から見るというイメージ
・マンガ (What) の売上部数
・amazon (Where) での売上部数
上記の4つの要素から情報を繋ぎ合わせることでストーリーを作り上げることができる。
データストーリーテリングへ繋げていく
When (いつ): 2023年8月下旬
Who (誰が): 小学生高学年の女子
Where (どこで): 町の書店
What (何を): 課題推薦図書に取り上げた本
これらの情報から「きっと夏休みの宿題の読書感想文をギリギリになって取り掛かるのだろう」といった洞察も得られます。
いかがでしょう。何も取っ掛かりのないなかで、いきなりデータを前にするよりも、4つの箱を作るイメージで、そこにデータを分類していくだけで、情報が整理されることを実感できたのではないでしょうか。こういったことからも、データを単なる数字の羅列、無機質なもの、と捉えるのではなく、4つの角度からデータの向こう側を覗いてみる。きっと各々それぞれのストーリーが思い浮かぶはずです。
次回はデータの「粒度」についてまとめたいと思います。