データからみる競輪予想印の見方その1：#機械学習 #競輪予想

2020年2月3日 14:53

#機械学習 #競輪予想

合同会社ムジンケイカクプロ、代表の通称ムジンさんです。

競輪ファンの方、もしくは大量データ好きの方、分析好きの方、こんちわ。
私は競輪ファンではありませんが、分析の対象として競輪を選んだのは、鍛えた人間の生身の戦いというのが好きだからです。
（プロレスや格闘技が好き）

いい脚してるわー

分析をしているうちにハマったのがここです。

予想紙面から、２着が予測できないということ。

そのままですね。

３着にくる選手というのは、１着２着に絡みそうな選手が、予測上、直感的に理解できる形で出力されてくるのですが、２着をビッタリ当てるのが難しいというところです。

過去に行われた約42000レースのデータから読む傾向と題して、データを見ていこうと思います。

print(df.groupby(['開催日','レース場','何日目','レース']).count())
[42613 rows x 33 columns]

Pythonによるスクレイピング

１，DBへ、各月ごとの開催情報のURLをExcelで作って格納。

２，開催情報のURLから、レースごとのURLを一覧化し、DBへInsert

３，２で作ったURLから、HTMLをローカル保存。

４，ローカル保存したHTMLから必要部分をスクレイピング

予想印に対する着順の集計です。

見栄えを変えました。

1.0が1着ということです。

◎が本命ということで、最も人気のある選手。
1着が多いですね。
適当に車券を買う時に、本命を買っておけばいいが・・・。

○の対抗という２番人気の選手。
やはり２着にくることが最も多いのですが、わりと他の着順にバラけています。

この数値が最も謎で、２着が当たらない理論と呼んでいます。

更に読んでいきます。

いつもお読みいただき、ありがとうございます。書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。