統計の差の検定手法選択フロー(参考)

今回は有意差検定を中心に統計手法の選択フローを簡単に作成しました。学んだことをフローにすると分かりやすく整理できました(情報収集結果や復習も兼ねて使用頻度高そうなものを抜粋。抜け漏れがありそうです)図を見ても良くわからない方はフロー図以下の説明を確認ください(なお検定手法の中身は他サイトご参照ください)。ベイズ統計は未記載のため参考として機械学習のアルゴリズム選びにも同じような”チートシート”と呼ばれるものがありますのでこちらのワードで検索してみてください。※統計手法前に散布図やヒストグラム、データによっては平行座標プロット、散布図行列、ヒートマップなどは確認したいところです。Pythonでは少ないコードで実行可能です。


上記のフローの詳細説明です。
有意差検定はある条件同士が偶発的な誤差などを加味しても差があるといえるかの問いの参考として役に立ちます。ざっくり説明するとそのある条件のデータの母集団を推定します。推定した結果に有意な差があれば、ある条件のデータへの影響は有意な差があるといいます。
図の分岐の説明を下記に記載します。
1.2群以下:例として実験したときの例ですが、関係性を見たい、実験環境が2条件以下のものか?と言えます。
2.正規性:それぞれの群は正規分布に沿うか?という問いで方法例としてヒストグラム(縦軸頻度、横軸対象パラメータ)の形状、QQプロット確認を記載。正規分布の詳細説明は他サイト参照ください。
3.対応有:例として10種の植物の生長観察する際、当日と数日後のデータは同じ植物同士では対応があるといえます。逆に違う植物同士の比較は対応がないという意味です。
4.等分散性:分散が等しいかどうかです。分散の説明は他サイト参照ください。
5.多重比較:多重比較ではどの群同士で有意差があるか見えます。その前のフローの分散分析などの有意差検定はどの群同士が分かりません。

この記事が気に入ったらサポートをしてみませんか?