2/16 確認作業
まず何はともあれ南関のTrain DataとTest Dataです。
※Train Dataは、出馬データと正解ラベル(着順)のセットです。これを機械学習させてAIモデルを作り、そのモデルにTest Data(正解ラベル無し)を見せて成績を予測します。
Train Dataで1件だけ488週というのが出てきました。
この馬のNサイト様の出馬データも見てみます。
データに戻り過去5走の着順を見てみると、Nサイト様ののデータベースと一致します。
念のためパープルキングをググってみるとやっぱり同一馬名がいました。
やはりNサイト様の場合、同一馬名の扱いが独特のようです。
ではGサイト様のほうはどうでしょう。
こちらは独自見解ではなさそうですね。
さて、Train Daraで1件発見されたこの異常Dataをどう捉えるか。
直しますか?削除しますか?
考えるのは後でゆっくりやればいいので、続いてTest Dataも見てみます。
181週というデータが1件
260週を超えてないんですが、一応見てみることにしました。
Nサイト様出馬データ
これは長期離脱っぽいですね。
南関に関してはTrain Dataに1件の異常あり。
この1件を潰して再度データを作り直すとなると、非常に面倒な割に目に見える効果は無いと思います。
どうするかもうちょっと考えてみます。
この記事が気に入ったらサポートをしてみませんか?