DS39:回帰分析の評価指標MSE,MAE,RMSE,MAPE,RMSLE【データサイエンティスト検定(リテラシーレベル)補習ノート】

データサイエンティスト検定(リテラシーレベル)の公式リファレンスブックで躓いたところをまとめていきます。

回帰分析の評価指標には様々なものがあります。テキストで数式がまとまって書かれていないのと、説明がない指標もあるのでまとめておきます。

MSE (Mean Squared Error)平均二乗誤差

実測値と予測値の残差の二乗の平均。予測を大きく外すとMSEも大きくなる。事前に外れ値を除外したほうが良い。

画像1

RMSE (Root Mean Square Error)平均平方二乗誤差

MSEのルートをとったもの。

MAE (Mean Absolute Error) 平均絶対誤差

残差の絶対値の平均。外れ値の影響を受けにくい。

画像2

MAPE (Mean Absolute Percentage Error) 平均絶対パーセント誤差

MAEやMAPEが絶対誤差であるのに比べ、MAPEは相対誤差になるのでスケールが異なる予測の比較がしやすい。

画像3

詳しくはこちらを参照してください。

RMSLE (Root Mean Squared Logarithmic Error) 対数平均平方二乗誤差

実際より少なく予測した場合に誤差が大きくなるため、下振れを防ぎたい場合に使う。

画像4

値の変化が大きい場合はRMSLEを使う代わりに、最初に対数をとったうえでRMSEを使うケースが多いそう。詳しくはこちらを参照してください。


参考資料



この記事が気に入ったらサポートをしてみませんか?