見出し画像

データ分析をするならはまず目的を決めましょう

いきなりデータを見始めるのはやめましょう

最初のnoteでは「データ分析とは意思決定のために行う」というお話をしました。

では「データ分析をして何か決めよう!」といきなりツールで数字を見たりプログラミングをし始めればうまくいく、というわけではありません。

目的を決めないで始めたデータ分析で何がおきるか、3つの代表的な例を挙げてみましょう。

目的を決めないで始めた「探索的データ分析」はただの雑学になる可能性大

「探索的データ分析」という言葉がありますが、目的を何も決めないでいきなりデータを見始めても大して役には立ちません。

データやツールで数字を見たり、いろいろな軸でグラフを書いてみたりすると

「男性20代と女性30代ではこんなに数字が違うぞ」とか

「性年代ではなく地方別で見たらどうだ」とか

なんてみんでワイワイとやる打ち合わせはきっと今日もあちこちで行われていることでしょう。

それで何かわかった気にはなれるのですが、何か決まったことはありますか。物事動きましたか。

「もっと細かく見た場合はどうなのか」とか「もっと詳しく調べよう」以外のことが起きた記憶がありません。そしていくらより詳しく調べたところでその先につながったこともありません。

結局そこで分かったことはただの雑学であり、何かの課題を解決するための役に立つことはありません。

ずっと後になって役立つことはあるかもしれませんが、いつどこで使われるかわからない知識よりも今すぐ解決しなければならない課題に向き合った方が有意義だと思います。

とりあえずデータを集めておく症候群

目的がないのにとにかくデータを集めればあとで何かに使えるかもしれないと膨大なリソースを費やす企業は後を絶ちませんが、それらが後でうまく使えたという話は聞こえてきません。

いくら高価で速く走れるF1マシンを手に入れても引っ越しには大して使えないことは想像がつきますが、データの場合はどうも見えない触れないことが原因なのか、「車」というところだけに反応してしまう人もたくさんいるようです。

集めておくにもタダではないですし、管理するにも人手がいります。いざ使おうとしても余計なデータが多すぎて前処理に時間を費やすといった弊害もあります。

もちろん、事前に集めておかないとあとで分析しようにもできないので集めることは重要です。しかし無暗に集めるのと、目的があってそこに向かっての先行投資の途中とははっきりと区別しないといけません。

もし何も考えずに集めたデータを使ってうまく行ったのだとしたらそれは単なる偶然だと思った方がいいでしょう。

今あるデータで何かできないか症候群

目的がないと「うまいこといってくれればそれでいい」とばかりに「今あるデータで何かできないか」を考えるようになります。

「集めてしまったから使わなければならない」なんていうのはなお悪い。

今あるデータというのは、すべてのデータから見ればほんのごくごく一部にしかすぎません。それなのに、そのデータを使うことを前提にしてしまうのはあまりにも選択肢が狭くはないですか。

目的があれば、ではそれを知るために必要なデータは何か?という流れになるのですが、とりあえず目先にあるものに飛びついてしまうのは目的がないからです。

もちろん、あらゆるデータが揃うわけもないですし、時間も予算も限られる中で結果的に「今あるデータでやれることをまずやってみよう」になることは十分にあり得ます。

ただしそれは「今あるデータで何かできないか」と他の選択肢を最初から排除してしまうのとは見た目は同じでも内情は全く違うのです。

とにかく「何が目的か」を考えましょう

最初から完璧な目的を持たなくてもあとで修正することはできますが、何も考えないでデータ分析をしても良い結果に繋がらない、ということは何度言っても足りないぐらいです。

こんなことを書いている自分もついやってしまいがちでその度に後悔するのですがそれでもなかなかやめられません。

これはもう、どんなデータを見る時にも意識し続けるべきことではないでしょうか。

この記事が気に入ったらサポートをしてみませんか?