データの理解と分析にお悩みの方へのヒント。
になればいいなぁと思って書いてみました。
日頃から、契約データや社内の営業活動ログ、顧客のwebサイトアクセスログなどをビジネス職として分析・加工しているのですが、ビジネス職だとデータにアレルギー多い人が結構いるなぁなんて思って、ポイントだけでも押さえたらきっと楽だと思うので、書いてみました。
0.まずはデータの種類を把握する
最近はEXCELやスプレッドシートがとっても便利なので、グラフとかピボットとか押したらサクッと描画してくれると思うのですが、できればローデータがどんな感じのデータなのかを理解したほうが色々はかどります。(と思います笑)なので、どんな感じのデータかを理解するための視点を3つだけご紹介します。
1.データ(レコード)の単位は何か?
最初のステップはここから。そのデータの1レコードがどういう単位で積み上がっているのかを知ること。(EXCELやスプシでいう1行の意味合い)
例えば、こんなデータがあったとき、
←のデータ単位は日付ごとっぽい。つまり1日ごとのデータがどんどんと積み上げられていっているっぽいとわかる。一方で、→のデータ単位は天気の種類ごとっぽい。つまり晴れ/曇り/雨などの種類ごとでデータが積み上がっているっぽいとわかる。
どこには重複があって、どこには重複がないのか。まずはこんな感じで1行の意味を理解することがスタートになると思います。
※大体の場合は、一番←の列が単位になるんだけどそうじゃないケースもあるのでご注意を。
2.データ(レコード)はどう更新されるか?
次に理解するといいのは、更新のされ方。例えば先程のこのデータ。
多分こういうふうに更新されると想像つきませんか?(赤字が更新箇所)
←のデータは、新しい日付で1レコードが追加されそう。でも、→のデータはレコードが追加されず、当てはまるものに上書きされました。(わかりやすくするために打ち消し線で旧データを入れてますが )
と、データの更新のされ方を理解することもとても大事。なぜなら、←のデータは放っておいても1日前や2日前のデータを自由に取り出したり確認したりできるが、→のデータは上書きされちゃうので過去のどこかのタイミングでのデータを取り出すことができない。→のタイプのデータなら毎日その日時点のデータを保存しておいたほうが無難ですよね。(これスナップショットとか言います)
3.キーとなる(なりうる)カラムはあるか?
vlookupとかあるデータとあるデータをくっつけたりして整理することもあると思いますが、逆にどんなデータをくっつけられそうか?という想像もとっても大事です。
例えばこのデータ、どういうデータをくっつけられそうでしょうか?
日付をキーと考えると、イベントカレンダーやその日のシフトに入ってた人数、来客数などをくっつけられそう。天気をキーと考えると、まぁ過去の平均売上とか?
こんな感じでキーになりそうなカラムがわかるとそれに紐付けてどんどんと意味あるデータを増やしていけるので、どのデータカラムがキーになるか?なりそうか?は把握しておくと便利です。
※全部くっつけるとこういうデータにできる※
7.まとめ
個人的にはこの3つのことを感覚的に理解できていれば、データの解釈や分析がかなりはかどると思います。
データの並びをざざっとCtrl+Aとかで全選択肢して、タブからグラフとか選択して、「あれ?思ってたイメージのグラフにならねぇな?」とか、「あれ、、、推移を見たいのに自動更新できなそうだし、今日時点しかわからんな...」みたいなことが起きやすい方はぜひご参考いただければ幸いです。
データは好きなので、次のステップとか他のトピックで2記事目書けたらいいななどと思っておりますので、何かあればTwitterで絡んでくださいw
この記事が気に入ったらサポートをしてみませんか?