データ分析するときに仮説立てる必要あるんですか?
我々の部署はデータ分析をやることが多いグループ。その分析データをもとに、CRMやメディアの改善、戦略立案などをしています。
さて、今回は第三弾として、データ分析する際に仮説を立てる必要はあるのか?というお話。
機械学習を専門としている私の目線で仮説立てする必要性について説明していきます。
※新人向けなので正確さよりもイメージのしやすさ重視です。
世の中には想像を絶する量のデータが存在している
総務省の調べによれば、2019年には世界のデータトラフィック量は月間161エクサバイトにもなると推計されています。
エクサとは10の18乗の単位です。つまり161000000000000000000バイトです。今までこの速度で毎月溜まっていますし、これからも溜まっていきます。
世界に溜まっているデータがいかに多いかがイメージできたかと思います。
情報を処理するなら、人間はAIには絶対に勝てない
そんな理解できない量のデータを人間が扱うことは極めて難易度が高い。おそらく、この情報量を人間が理解しようとすると脳みそが機能不全に陥るでしょう。
そんな膨大なデータを処理するのが得意なのがAI(機械学習)。最近巷で話題ですね。
AIは、間違えずに、繰り返し、試すことが得意です。どんなにデータ量が増えてもルールが決まっているなら、間違えることはありません。
AIは、大量のデータを処理し、傾向分析や予測することに、人間よりも圧倒的に優れています。
そして、こうでした!と結論を教えてくれます。
しかしながら、AIはその理由が答えられません。ここがAIの苦手なところ。
「結果はこうなんだけど、理由はわかりませーん」という感じです。
人間は仮説の確からしさを高めるためにデータを使う
さて、じゃあ人間はどうしたらいいのでしょうか?
それは、AIの苦手な「理由を答える」という部分に着目することで、データの扱い方を変えます。
AIは、データから傾向や予測を精度高く実行します。
これに対して、人間は「仮説を立て、その確からしさを高めるためにデータを使う」という概念に切り替えることで、価値を発揮できます。(最近こういうAIも出てきてますがここでは割愛)
「おそらく〇〇が理由で問題が起きているだろう」という仮説を立て、それが本当かという視点でデータを分析する。
データがその仮説通りになっていれば、問題が起きている理由の確からしさが高まります。
つまり理由を説明するためのデータという位置づけです。
そうすることで、見るべきデータを絞ることができ、AIには到底勝てない膨大なデータの処理とはおさらばです。生産性も圧倒的に向上します。
筋の良い仮説を立てるには
仮説の引き出し(多分こうだろう)を徹底的に増やすことが重要です。
下記の記事にも書いた、ユーザに会いまくるというのは、断固たるWhyを作る以外にも、こんな効果があるのです。
ユーザに会いまくり、引き出しを増やし、仮説を立て、データが扱えるようになることで、人間らしい価値を発揮できると信じています。
この記事が気に入ったらサポートをしてみませんか?