[競馬予想AI] 不均衡データの対応と評価指標の考察
前回に引き続き、競馬予想AIのモデルチューニングを行いましたのでその内容をまとめて紹介します。
前回の内容はこちら
今回の内容は大きく2つ。「不均衡データに対応するためのオーバーサンプリング」と「評価指標のMCCとPR曲線のAUC」についてです。
オーバーサンプリング不均衡データの学習をする際、多いクラスのデータを減らす「アンダーサンプリング」と少ないクラスのデータを増やす「オーバーサンプリング」を使うことがあります。
両者のデメリットは次のようなものがありますので、注