データ・ドリブン社会の創発と戦略(安宅和人)　第三回

2020年4月25日 12:46

上記の講義を受けて有益であったinputを備忘録としてまとめていく。

・きれいなデータを集めるのは大変だが分析には絶対必要

ex)アンケートに答えたらクーポンあげます→集まるデータが貧困そうに偏る

まず仮説を立てる。課題の確認をする。
そしてその仮説を検証するためには(課題を解決するためには)どのような軸で比較する必要があるかを考えればおのずと見えてくる。

言い方を変えると、
伝えたいメッセージの言語化をしたうえでどのようなロジックでそのメッセージが支えられるか考える。そのうえでどのような軸をたてればよいか思考する。

差比較：変化・違いそのものに意味のあるときには適しているが、母数をすべて示さなければ人を欺くことになる。

割合比較：インパクトを示すのには適しているが、比較軸をきちんと取らなければ人を欺くことになる。

サンプリング判断：信頼度95％(サンプリング誤差5％以下)に収めるには母数はいくつ必要かの判断

データの性質の理解＋表現：平均、分散、標準偏差など駆使してデータの本質を理解する。

分析結果の判断：標準誤差などで、使えるものか使えないものか判断する。

解析、統計モデリングのベース：未来などの予測をする。未来といえどパターンが見いだせれば予測は可能。

データの細かさ、目的、ロングテールの長さなど複合的に決まるので困難

スクリーンショット (38)

ロングテールの例
縦軸：frequency　横軸：検索ワード(左からfrequencyの高い順)

慶應義塾大学　データ・ドリブン社会の創発と戦略第03回
安宅和人

この記事が気に入ったらサポートをしてみませんか？