見出し画像

2/16 確認作業

まず何はともあれ南関のTrain DataとTest Dataです。

※Train Dataは、出馬データと正解ラベル(着順)のセットです。これを機械学習させてAIモデルを作り、そのモデルにTest Data(正解ラベル無し)を見せて成績を予測します。


Train Dataで1件だけ488週というのが出てきました。

キャプチャ11


この馬のNサイト様の出馬データも見てみます。

キャプチャ11


データに戻り過去5走の着順を見てみると、Nサイト様ののデータベースと一致します。

キャプチャ11


念のためパープルキングをググってみるとやっぱり同一馬名がいました。

やはりNサイト様の場合、同一馬名の扱いが独特のようです。



ではGサイト様のほうはどうでしょう。

キャプチャ11


こちらは独自見解ではなさそうですね。


さて、Train Daraで1件発見されたこの異常Dataをどう捉えるか。

直しますか?削除しますか?



考えるのは後でゆっくりやればいいので、続いてTest Dataも見てみます。

181週というデータが1件

260週を超えてないんですが、一応見てみることにしました。

キャプチャ11


Nサイト様出馬データ

キャプチャ11

これは長期離脱っぽいですね。

キャプチャ11




南関に関してはTrain Dataに1件の異常あり。

この1件を潰して再度データを作り直すとなると、非常に面倒な割に目に見える効果は無いと思います。


どうするかもうちょっと考えてみます。

この記事が気に入ったらサポートをしてみませんか?