データ分析を始めるにあたり最低限知っておくべきこと

まずやってみるのはいいけれども限度はあるはず。それはどこだ

サッカーに興味があるならば、ルールブックを熟読するよりも先にとにかくサッカーをやってみるのがいい、ということに反対する人はあまりいないと思う。

とはいえ全く何も知らないのではゲームが成立しなくなってしまうので、最低限知っておくべきことはあるはずだ。例えば、どうなったら得点になるのかは必須だろう。あとはゴールキーパー以外は手を使ってはいけないとか、範囲を出たらスローインになるとかだろうか。

では「データ分析」における「最低限知らないといけないこと」は何なのだろうか、と考えた内容をまとめた。

前提として、本記事の「データ分析」は「意思決定のための情報=インテリジェンスを作ること」に絞る。言い換えると、システムに組み込んで意思決定と行動を自動化するような「データ分析」は対象外とする。

インテリジェンスについての説明は「情報」には「データ」と「インテリジェンス」があるに書いている。

データ分析を始めるにあたり最低限知っておくべきこと

本当に最低限知っておくべきことは何かと考えた末に、以下の項目に絞り込んだ。

  • 決める前にやる

  • 目的無きデータ分析は無駄である

  • 過去の数字を見ることはデータ分析ではない

  • 完璧なインテリジェンスは存在しない

決める前にやる

すでに意思決定されていても、後で正しい情報が出れば決定は変わる、と思っていたら大間違いだ。

物事が動いていれば予算、スケジュールや利害での様々な調整が必要になりさらにコストがかかってしまうために簡単には方向転換できない。意思決定者が間違いを認められないこともある。それが外部からの指摘であればなおさら難しくなる。

先に決めて実行した後に”効果測定”をしようとしても都合の良いデータを集めたり、必要なデータが集められなかったり、適当に決めたKPIを追うだけになったりとろくなことがない。

修正するならば動き出す前にする方が遥かに楽であり、動き出す前に修正するならばそのための「データ分析」は意思決定より先にやらなければならない。

目的無きデータ分析は無駄である

  • 何となくデータを見ることで目的など生まれない

  • まず目的ありき。そして必要だったらデータ分析をする。逆ではない

  • 今あるデータから見えるものだけしか見えなくなるのは非常に危険

  • 目的なしに集めたデータは単なる雑学に過ぎない

  • なんとなく仕事をした気にはなれるが、何も生み出さない

  • 「とりあえずデータを集める」ことで得をするのはツールベンダーぐらい

目的なきデータ分析は無駄である

過去の数字を見ることはデータ分析ではない

「データ分析=過去の数値を見ること」みたいな話はよく聞くが「勉強=学校で教わること」ぐらいの誤解である。つまり、範囲を狭くとらえすぎている。

意思決定に必要なのは、通常は未来のことに対する予測である。過去の数値とは未来のことを考えインテリジェンスを作るための材料=データである。つまり、データを見ることはデータ分析の一部でしかない。

過去のデータは食材に例えてもいいだろう。食材だけ集めても調理されなければ料理にはならない。

同じ様にデータも分析に使われなければインテリジェンスにならない。インテリジェンスを作り出していないのではデータ分析として成立しておらず、途中で止めているということだ。

完璧なインテリジェンスは存在しない

世の中に完璧に未来がわかるなどということはほぼありえない。100%何が起きるかを示すインテリジェンスは存在しない。だからデータ分析なんか意味がない、というのは極端すぎる。

「家の前に止まってくれて目的地まで直行しないから飛行機は意味がない」とは言わないだろう。空港が遠くて不便でも、移動の時間全体を考えると歩くよりは早いから飛行機を使っている。

データ分析とは曖昧な未来に対して、不確実性を減らす試みである。不確実性は0にできなくとも、何もしないよりは不確実性を減らすことができるか、少なくとも期待されている。完璧なインテリジェンスではなく、よりよいインテリジェンスを求めるのがデータ分析への正しい向き合い方である。

最低限にいれようとおもったけど基本的なこと

最低限、なのであまり多いとまとまらない。なので「最低限必要なこと」に入れようとしたけれどもやめた項目を挙げておく。

  • インテリジェンスとデータと提案を区別せよ

  • 知りたいことに前提をおくな

  • データの収集は重労働である

  • 一人ですべてを行う必要はない

  • インテリジェンスに従わなければならないということはない

  • 願望を忘れよ

まだありそう。

「データ分析で最低限知らないといけないこと」とは「みんなが知っておかないといけないこと」

意思決定は誰もが行っていることである。つまり、「データ分析で最低限知らないといけないこと」とは「みんなが知っておかないといけないこと」でもある。

ところが、ビックデータとデータサイエンティストのブームから大きく動き出したデータ活用は10数年を経て、共通認識が出来て全体の底上げがされるどころかますます混乱しているようにも見える。

そもそも情報に対する扱いがおざなりな文化であるところに突然ブームが起きたので仕方ない面はあるだろう。しかし、もうちょっと起動修正する試みがされても良いのではないか、という思いが強くなっている。そこで、データ分析についてまず知っておいて欲しいことを自分なりにまとめた。

そのうち増えたり減ったり変わったりするはずだが今時点で思うことを書いた。これは入れるべきだ、いやこれは不要だ、内容はこの方が良い、とか議論のきっかけになってくれたらうれしい。

この記事が気に入ったらサポートをしてみませんか?