DS26:重回帰分析【データサイエンティスト検定(リテラシーレベル)補習ノート】

データサイエンティスト検定(リテラシーレベル)の公式リファレンスブックで躓いたところをまとめていきます。

偏回帰係数と標準偏回帰係数

重回帰分析は以下の式で表され、a1,a2などを偏回帰係数と呼びます。

画像1

もし各説明変数を平均0標準偏差1に標準化していた場合、a1,a2などは標準偏回帰係数と呼ばれます。


Excelで重回帰分析をするにはデータ分析のアドインを利用します。

Pythonの場合はscikit-learnのLinearRegressionを使うと簡単だと思います。

重相関係数

重相関係数とは目的変数の実測値と予測値の相関係数のこと。0~1の値をとります。

ただ、Excelのデータ分析アドインを利用した場合は重相関係数の二乗である「重決定 R2」を使う方が多いのではないかと思います。これは目的変数を重回帰式で説明できた割合を示します。1に近いほどよくあてはまる回帰式だと考えられます。

Pythonでscikit-learnを使う場合は、sklearn.metrics.r2_scoreで出力できます。


参考文献


この記事が気に入ったらサポートをしてみませんか?