【機械学習+競輪予想】人気通りに買える安定したレース場はどこかを計算で割り出す

2020年3月22日 11:30

というわけで、予想印通りに着順が決まりやすいレース場を探します。

偏差値

全体で20177レース

これの着順の平均を出しておく。

###########全体平均
grouped_mean_all = df.groupby(["予"]).mean()
print(grouped_mean_all.head(20))

予　result
無印　5.874988
× 4.084528
▲ 4.939109
△ 4.565171
○ 3.750135
◎ 2.709216
注 5.524945

これで予想印のパワーが分かる。
無印はなかなか買えない。

◎の偏差値

◎だけの全体の着順平均を出す。

df_q = df.query("予=='◎'")
grouped_mean_all = df_q.mean()
print(grouped_mean_all.head(20))

result 2.709216

合っている。

レース場ごとの◎の着順平均を出す。

grouped_mean = df_q.groupby(["レース場","予"]).mean()
print(grouped_mean.head(20))

レース場予
aomori ◎ 2.478618
beppu ◎ 2.540264
fukui ◎ 2.765586
gifu ◎ 2.701657
hakodate ◎ 2.697674
hiratsuka ◎ 2.791423
hiroshima ◎ 2.632517
hofu ◎ 2.703448
ito ◎ 2.828512
iwakitaira ◎ 2.713080
kawasaki ◎ 2.609589
keiokaku ◎ 2.644592
kishiwada ◎ 2.630170
kochi ◎ 2.605863
kokura ◎ 2.572477
komatsushima ◎ 2.960843
kurume ◎ 2.756646
maebashi ◎ 2.765683
matsudo ◎ 3.039557
matsusaka ◎ 2.607438

こんな感じ。
これが高いほど、一番人気が負けやすい。

ただこれだと、各レース場の母数が違うので、レース数が少ないところと多いところを、同じものとして評価してしまう。

1票の格差的なものとして、、、（違う？）

ここからは情報の取捨選択に自信がある方のみ、御覧ください。
どのレース場が人気通りになるのか計算で推測しています。

※計算間違いがある可能性も含みます。予めご了承ください。

「全体の◎予想の着順」の平均と標準偏差を出す

ここから先は

3,368字

¥ 111

期間限定 PayPay支払いすると抽選でお得に！

ログイン

いつもお読みいただき、ありがとうございます。書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。