【読書メモ】西内啓『統計学が最強の学問である』11
読んだ本
読書マインドマップ
読書メモ
第5章 ランダム化できなかったらどうするか?
重回帰分析:説明変数が複数ある状況に拡張された回帰分析
ロジスティック回帰:重回帰分析の拡張
シンプソンのパラドクス:全集団同士の単純比較は、その内訳の小集団との比較の結果とは異なる
→層別解析でパラドクスは防げるが、考慮すべき条件が多くなるとうまくいかなくなってくる重回帰分析
層分けを不要にする
複数の回帰係数を同時に推定する
複数の回帰係数は「お互いに相乗効果がなかったとすれば」という仮定のもと、説明変数が結果変数にどの程度影響を与えるかを示す
ロジスティック回帰
結果変数を二値(0 or 1)に変換して連続的な変数として扱う
→重回帰分析が行えるようにした回帰係数をオッズ比(約何倍でそうなりやすいか)で示す
感想
『統計学が最強の学問である』は、カイ二乗検定→重回帰分析/ロジスティック回帰分析の順番で分析手法を紹介しています。統計学のテキストにあるように、代表値(平均値、中央値、最頻値)やヒストグラム、相関と回帰分析から始めていません。数学的な難易度で学ぶ順番を決めるよりも、実践の場で使われることの多い順番から学ぶほうが、かえってイメージしやすく学びやすいのかもしれません。
ロジスティック回帰を利用した、国立感染症研究所の分析があります。接種回数と接種からの期間が有効性に影響を与えることが示唆されています。
実際の調査を見ると、統計学の使われ方がわかってよいと思います。
最後まで読んでくださった方ありがとうございます。よろしければサポートいただけますと幸いです。本を買い、noteを書き続け、読書文化の輪を広げるために使います。