データを理解する力

こんばんは。
先日、応援の力なんて記事を書きましたが、12月3日。北海道コンサドーレ札幌のリーグ最終戦が開催されました。
レジェンド小野伸二の引退試合でもあったんですね。
私は試合が始まる30分前には声が枯れておりました。。。
試合も残念な結果に終わりましたが、新しい景色を見るために、来季に向け準備をしてもらいたいです!


前回はデータによる意思決定について、記事に起こしました。

今日はデータを理解する力についてです。
意思決定をする上で必要なことは前回のを読み返しつつ、「データ」をどうやって扱い、理解すればいいのかという事の基本編を書いていきたいと思います。

まずデータって膨大なもののイメージがありませんか?
1年分の売上データ、お客さんのデータなどなど
人間の目にはとても大量すぎて手に負えないもの、ではないでしょうか。

ではでは、どう対応していきましょう?
データを集めて集計することで、見やすくしていますね。
すなわち、データを集計することでデータの洞察ができるようになるわけです。


ではこの「集計」
これは勉強していて、なるほどな、簡単なようで難しいなと思いました。

データをどの単位で集めるのか
データをどの塊で集計するのか
によって結果は変わってしまいます。

結論は、正しい粒度のデータを集めることによりベストな回答に近づいていくという事ではあるのですが、少し細かく書いてみます。

先述の通り、データの粒度を操ることによって得られるインサイト、洞察の違いは間違いなくあります。

例えば
①時間
・全地球史(億年単位)
・動画のコメント(秒単位)

②場所
・世界のGDP(国単位)
・移動履歴(緯度・経度単位)

③人
・人口ピラミッド(年齢、性別単位)
・カルテの情報(個人単位)

④モノ
・カテゴリ別売上(カテゴリ単位)
・製品別売上(製品単位)

具体例を出すとわかりやすいかと思います。単位があまりに違うと小さい方が埋もれてしまい、得たいもの、知りたいことが手に入れられないという事になります。

という事で、「データの粒度」を知り、操れるようになることは、データを理解する力の一つになります。


次に、計算方法の特徴を理解することも大切です。
よく見る例として

・合計(全部の数字を足し合わせる)
・平均(合計した数をデータの個数で割る)
・最大値(集計した数値の最も大きい数値)
・最小値(集計した数値の最も小さい数値)
・中央値(これ私知りませんでした…=平均だと思っていました)
中央値とは、全体の数字の真ん中を取る事です。例えば
1 2 3 4 1000 という数字があったとしましょう。
平均は202となります。
これはわかりますよね。

この時の中央値は3が正解です。
「全体の数字の真ん中」となると3になるからですね。
これ衝撃でした…恥ずかしいですが。

202と3、とんでもなく違う数値でしたね。
このように、当たり前と思っていた集計方法にも違いがあり、理解をすることで考え方が変わることもあるでしょう。

ここまでお話しした①データの粒度②計算方法を適切に選ぶことで
私たちは様々な角度からデータを俯瞰して分析ができるようになります。


当たり前の方は当たり前、私の雑な文章で全て伝わるとは思いませんが、データを分析する第一歩として、基本はすごく大事だという事がわかりました。


①②にストーリーを乗せていくとどうなるか。
それはまた別の機会でかければなと思います。

この記事が気に入ったらサポートをしてみませんか?