【読書】統計学が最強の学問である
P.51
標準誤差とは
サンプルから得られた割合(たとえば失業率)に対して標準誤差の2倍を引いた値から標準誤差の2倍を足した値までの範囲に真の値が含まれている信頼性が約95%、という値
サンプリング失業率が25%、標準誤差が0.5%とした場合、真の失業率も24%~26%の間にあると考えられる、みたいな感じ。
P.59
ビジネスにおける具体的な行動に繋げるために大事な3つの問い
➀何かの要因が変化すれば利益は向上するのか?
➁そうした変化を起こすような行動は実際に可能なのか?
➂変化を起こす行動が可能だとしてその利益はコストを上回るのか?
結局のところ、実現性とインパクトが大事ってこと。これらの問いにすべて応えられるアウトプットじゃないと「ふ~ん」で終わっちゃうよね。
P.84
P値とは
実際には何の差もないのに誤差や偶然によってたまたま差が生じる確率
この値が5%以下であれば、「この結果は偶然得られたとは考えにくい」と判断する。
使い方はなんとなく分かったけど、具体的になんなの?って問いに対しては下記のサイトが分かりやすかった。(たぶんまた忘れるから貼っておく)
P.96
一時点のデータから因果関係の向きがわからないというのは、じつはこの比較している集団が同じ条件ではない、つまり「フェアではない」ということに由来している。
↓
解決方法
解析ではなくそもそものデータの取り方の時点で「フェアに条件を揃える」
要するに、ランダム化比較実験 ≒ A/Bテストをするということ。
相関関係はあるけど、因果関係についてはよく分からないってことはめっちゃよくある。その解決策としてはとりあえずランダムな条件下でA/Bテストやるのが良いですよ、っていうお話。
現場でも施策出してデータ見たけどよく分からんってことはよく起こるんだけど、大体の場合ってノイズになるような色んな要素を排除しきれない中で施策リリースしちゃってムリに分析しようとするのが原因で、「データの取り方」を事前にしっかり設計しておくことがマジで大事だと思う。
この記事が気に入ったらサポートをしてみませんか?