日本ダービー 禁断の複勝率100%のデータ予想 やはり人間のデータ予想は信頼出来ない?そこはAIに任せるべき!
さあ日本ダービーです。私は何度も「データ予想は人間がするな!」主張していますが、私も人の子?「どーしてもダービーだけは自分の力で的中させたい。」とダークな心が動いてしまい?データをTARGET-JVで調べてしまいました。
前走皐月賞で単勝1番人気の馬の日本ダービーでの成績は?
※データの有る1986年以降
※推しの北村宏司騎乗の惨敗したレガレイラの可能性を探りたくなってしまった?
過去に該当馬が33頭が日本ダービーに出走していますが、
1着13頭
2着1頭
3着4頭
馬券圏外15頭
勝率39.4% 連対率42.4% 複勝率54.5%
自分の予想に都合よくデータを絞り込んでしまうのが人間の性?
複勝率54.5%では、私的には納得がいかないので、勝手なデータの絞り込みしてしまいました。
それはお得意の「ノーザンファーム生産馬」という条件を加えてしまいました。
これで複勝率が72.7%まで上昇しました!
こうなると人間はもっと今年の日本ダービーに都合の良い条件を考え始めてしまうものなのですね?
さあ私は何をしたのでしょうか?よーく上記のスクショを見て下さい。
該当馬複勝率100%の鉄板データ!?
父ミスプロ系を除けば、複勝率100%!!!!
結論 今年のレガレイラは馬券圏内は100%で間違いなし!?
このデータ予想の問題点は
この条件の該当馬に牝馬はいない。
前走(皐月賞)からの騎手の乗り替わりの場合のデータが反映されていない。※まあいろいろと条件は違うが乗り替わりが良くないことは解るデータ
、昨年のタスティエーラは前走(皐月賞)では5番人気
データ予想は恐ろしい競馬認知バイアスを発生させる。
※私は競馬を予想する上で発生する認知バイアスを「競馬認知バイアス」と呼んでいます。
人間が行うデータ予想は一見、勝率、連対率、複勝率などは数値が算出されて、定量的に見えるものですが、実はデータの絞り込みは非常に曖昧なものなんです。例えば「過去10年皐月賞6着以下から日本ダービーに出走する馬で東京芝未勝利の馬は勝てない」というデータが有りますが、6着以下って勝ち馬からのタイム差は?、勝ち馬のタイムは?、馬場状態は?。東京芝未勝利って距離は?それとも未出走なの?そもそも過去20年遡ると勝ち馬も存在するが(ロジユニバース)、それをどう説明できるのでしょうか?
要するに過去10年も、皐月賞6着以下も都合よく導かれた条件なんですよね。人間は自分に都合よく物事を考えてしまう傾向にありますので、データを都合よく絞り込んで、勝手に答えを出してしまうのですよ。
そしてそのデータが複勝率100%となると、「自分だけがこのデータ予想を知ってしまった。」「このデータ予想を考え付いたのはもはや運命だ!」と感じてしまい、そのデータのネガティブな面は全く見えなくなってしまうのが、正に競馬認知バイアスなんですね。
テータ予想は過去の結果に過ぎません。
私は過去に「皐月賞を単勝1番人気で勝ち、日本ダービーでも単勝1番人気の馬は馬券圏内を外さない。」というデータを信じすぎてしまい、ロジャーバローズを狙いながら、サートゥルナーリアを外した馬券が買えずに痛い目に会いました。
私はデータ予想というのは過去の結果であって、未来を明確に予測するものでは無いと思った方が良いと思っています。
私達は馬柱に記載されているような事項はAIに学ばせているので、人間が行う定性的な判断よりも、AIが数値化した定量的な数値をもって各馬の可能性は評価するべきだと提案し続けています。
今年の日本ダービーについて
さあ今年の日本ダービーは?
昨年の私の日本ダービーの予想のポイントは、堀亘行調教師の日本ダービー2勝目でした。
今年の日本ダービーでの予想のポイントは、ルメールの日本ダービー2勝目と矢作芳人調教師の3勝目で、友道康夫調教師の1番人気での4勝目は全くイメージが湧いてきません。
おそらくAIスコア複勝1位はジャスティンミラノかレガレイラだと推測しますが、もしかしたら2頭共に同じアルゴリズムで単勝を予想させたAIスコア単勝でも0.5を超えて単勝推奨馬に出力されるかもしれませんね。
私は未だにジャスティンミラノに対してネガティブなイメージしかないので、このイメージを消し去って、フラットな感情でダービー当日を迎えたいと思っています。特定の馬に何か変な思い込み(バイアス)を持つことは冷静な判断を鈍らせますからね。
競馬の予想とはある意味バイアスとの戦いなんですね。
以上
AIスコアを参考にして馬券が的中しましたらほんの少しだけサポートして頂けるとやる気が湧いてきます。趣味とは言え家族を犠牲にして莫大な時間を費やしております?