DS39:回帰分析の評価指標MSE,MAE,RMSE,MAPE,RMSLE【データサイエンティスト検定(リテラシーレベル)補習ノート】
データサイエンティスト検定(リテラシーレベル)の公式リファレンスブックで躓いたところをまとめていきます。
回帰分析の評価指標には様々なものがあります。テキストで数式がまとまって書かれていないのと、説明がない指標もあるのでまとめておきます。
MSE (Mean Squared Error)平均二乗誤差
実測値と予測値の残差の二乗の平均。予測を大きく外すとMSEも大きくなる。事前に外れ値を除外したほうが良い。
RMSE (Root Mean Square Error)平均平方二乗誤差
MSEのルートをとったもの。
MAE (Mean Absolute Error) 平均絶対誤差
残差の絶対値の平均。外れ値の影響を受けにくい。
MAPE (Mean Absolute Percentage Error) 平均絶対パーセント誤差
MAEやMAPEが絶対誤差であるのに比べ、MAPEは相対誤差になるのでスケールが異なる予測の比較がしやすい。
詳しくはこちらを参照してください。
RMSLE (Root Mean Squared Logarithmic Error) 対数平均平方二乗誤差
実際より少なく予測した場合に誤差が大きくなるため、下振れを防ぎたい場合に使う。
値の変化が大きい場合はRMSLEを使う代わりに、最初に対数をとったうえでRMSEを使うケースが多いそう。詳しくはこちらを参照してください。
参考資料
この記事が気に入ったらサポートをしてみませんか?