DS26:重回帰分析【データサイエンティスト検定(リテラシーレベル)補習ノート】
データサイエンティスト検定(リテラシーレベル)の公式リファレンスブックで躓いたところをまとめていきます。
偏回帰係数と標準偏回帰係数
重回帰分析は以下の式で表され、a1,a2などを偏回帰係数と呼びます。
もし各説明変数を平均0標準偏差1に標準化していた場合、a1,a2などは標準偏回帰係数と呼ばれます。
Excelで重回帰分析をするにはデータ分析のアドインを利用します。
Pythonの場合はscikit-learnのLinearRegressionを使うと簡単だと思います。
重相関係数
重相関係数とは目的変数の実測値と予測値の相関係数のこと。0~1の値をとります。
ただ、Excelのデータ分析アドインを利用した場合は重相関係数の二乗である「重決定 R2」を使う方が多いのではないかと思います。これは目的変数を重回帰式で説明できた割合を示します。1に近いほどよくあてはまる回帰式だと考えられます。
Pythonでscikit-learnを使う場合は、sklearn.metrics.r2_scoreで出力できます。
参考文献
この記事が気に入ったらサポートをしてみませんか?