4/30 機械学習の試行錯誤は楽しい
ちょっとヘヴィな数式の理解等に時間がかかり、なかなか日記を書く時間が取れませんでした。
試行錯誤の内容は、JRAデータをサポートベクターマシン(SVM)という機械学習アルゴリズムを使って分類するというちょっと今更感のあるもの。
相関関係を見て少しずつ指数を重ねながら新たな特徴量を作りSVMにかけて分類境界線を描画。
実に楽しい。
実戦ではとりあえず精度が出る可能性が高いDeepLearningやLightGBMなどの説明可能性が低いアルゴリズムばかり使っていたので、SVMのいちいちどんな分類境界線が引けたのか、つまりデータの形やパラメータを変えるとどんな分類の仕方になるのかを図示してくれる健気な姿に今更ながら感動。
SVMだけでは競馬データを扱うのは正直しんどいが、弱学習モデルにおける分類の結果というものが一つの特徴量として意味があると捉えているので、引き続き他のアルゴリズムでも試してみたい。
いやはや本当に恐ろしく素晴らしい趣味である。
この記事が気に入ったらサポートをしてみませんか?