マガジンのカバー画像

競馬予想AI開発記

21
競馬予想AIの開発記事をまとめています。現在は無料でご覧いただけます。
運営しているクリエイター

2020年4月の記事一覧

[競馬予想AI] 不均衡データの対応と評価指標の考察

前回に引き続き、競馬予想AIのモデルチューニングを行いましたのでその内容をまとめて紹介します。 前回の内容はこちら 今回の内容は大きく2つ。「不均衡データに対応するためのオーバーサンプリング」と「評価指標のMCCとPR曲線のAUC」についてです。 オーバーサンプリング不均衡データの学習をする際、多いクラスのデータを減らす「アンダーサンプリング」と少ないクラスのデータを増やす「オーバーサンプリング」を使うことがあります。 両者のデメリットは次のようなものがありますので、注

[競馬予想AI] モデルを改良、調整していく

前回は現在作っている競馬予想AIについてサラッと紹介しました。 今回はそのAIの改良と調整について紹介しようと思います。 評価指標を熟慮するまず、モデルの性能が良くなっているのか悪くなっているのか判断するための指標をきっちり決めておく必要があります。指標は次のようなものがある。 ・Accuracy(正解率) ・Precision(適合率) ・Recall(再現率) ・F1値 ・ROC-AUC 今回取り扱うデータは勝ち馬をラベル1、それ以外の馬をラベル0として扱うので不

[競馬予想AI] 競馬予想AIをつくる(概要)

競馬予想AIをつくるに当たっての概要についてnoteします。 ▼詳細な開発過程はこちらのマガジンに随時追加しています。 なぜ競馬予想AIなのかなぜ競馬予想を選んだかというと、やはり競馬の予想が難しいという点と、成功した暁にはリターンがありモチベーションがあるという点です。 オープンデータを含み今やネット上で大量のデータに触れることができます。肺疾患者のレントゲン画像データなんてものもあります。このデータから何かを高い精度で診断できるAIが作れたとすればそれは凄いことです