データ・ドリブン社会の創発と戦略(安宅 和人) 第三回
上記の講義を受けて有益であったinputを備忘録としてまとめていく。
・きれいなデータを集めるのは大変だが分析には絶対必要
ex)アンケートに答えたらクーポンあげます→集まるデータが貧困そうに偏る
・条件軸・結果軸の立て方
まず仮説を立てる。課題の確認をする。
そしてその仮説を検証するためには(課題を解決するためには)どのような軸で比較する必要があるかを考えればおのずと見えてくる。
言い方を変えると、
伝えたいメッセージの言語化をしたうえでどのようなロジックでそのメッセージが支えられるか考える。そのうえでどのような軸をたてればよいか思考する。
・差比較と割合比較
差比較:変化・違いそのものに意味のあるときには適しているが、母数をすべて示さなければ人を欺くことになる。
割合比較:インパクトを示すのには適しているが、比較軸をきちんと取らなければ人を欺くことになる。
・統計数理の役割
サンプリング判断:信頼度95%(サンプリング誤差5%以下)に収めるには母数はいくつ必要かの判断
データの性質の理解+表現:平均、分散、標準偏差など駆使してデータの本質を理解する。
分析結果の判断:標準誤差などで、使えるものか使えないものか判断する。
解析、統計モデリングのベース:未来などの予測をする。未来といえどパターンが見いだせれば予測は可能。
・データの値付けは困難
データの細かさ、目的、ロングテールの長さなど複合的に決まるので困難
ロングテールの例
縦軸:frequency 横軸:検索ワード(左からfrequencyの高い順)
慶應義塾大学 データ・ドリブン社会の創発と戦略 第03回
安宅和人
この記事が気に入ったらサポートをしてみませんか?