ファイナンス機械学習:メタラベルの使用法

 適合率がそれほど高くなくても、再現率が高い一次モデルを作る。この一次モデルの目的は、偽陽性を多く含んでいても、陽性になる可能性を含む全ての例を網羅することである。
 このモデルの低い正解予測に対し、二次モデルでメタラベルを適用することで、偽陽性を取り除けば良い。

 二項分類器の一次モデルを訓練し、ROC曲線、PR曲線を用いて高い再現性のものを採用する。
 次に、この一次モデルの特徴量と一次モデルの予測を繋げ、二次モデルの特徴量($${\bt{X}}$$)とする。一次モデルから得たメタラベル(予測結果とは違うことに留意)は、この二次モデルのターゲット(y)となる。
 二次モデルの予測と一次モデルの予測を比べ、両方とも陽性であったものが、真の陽性となり、一次モデルの偽陽性が取り除かれる。

この記事が気に入ったらサポートをしてみませんか?