「黒猫ツール」のトリセツ -「ST大全」編-
良い名があれば変えます。
「黒猫ツール」は競艇予想支援ツールとして、大きく4つの予想要素を提供してきました。
こんな機会なので、多少振り返っておくと、
「画像・映像解析系」で2種類。
「ST展示スリット解析」
「2MLAP解析」
「レーティング系」で2種類。
「黒猫Rating」
「観艇望気」
これら従前のツールについても、特に「画像・映像解析系」など全R対応できていないものをより多くのレースで提供できないか技術的模索をしているところです。
今回は、また別の視点の「新ツール」の提供を始める準備が整ったので、それについてお話ししたいと思います。
すでにアイディア段階においても、Twitterあるいはnoteでも目出していたものですが、「スタート」にまつわるデータキュレーションです。
事程左様に、私黒猫が提供するツールのベースはオープンデータです。それは、誰でも手に入れられます。一部に、誰でも手に入れられるけれど、その瞬間に居合わせないと手に入れられないデータを含みますが、
大部分、'boatrace.jp'をひっくり返せばあらゆる生データに当たれますし、数多ある便利なデータ分析サイトでも自分が必要とするデータに辿り着くことができるでしょう。
そんな中で、なぜ「黒猫ツール」を展開するのか。
それは、アクセスできるデータが溢れかえっているからです。
上で述べた通り、現在ではデータ集計の切り口を簡単にカスタマイズでき、あらゆる視点に立つことができます。
しかし、本当にそれは勝負に優位性をもたらしてくれるでしょうか。
情報は多い方が良い。だいたいあってると思います。
しかし本当は、結果に結び付く情報に精通し、勝負戦略の軸を持って、勝負できると良い。なのだと考えます。
その為、この便利すぎる情報の洪水は、必ずしも良い状況とは言えないのです。
そこで、私は競艇予想要素のキュレーターになることにしました。
「キュレーター」とは、有り体に言うと「学芸員」のことですが、
現在では、ある分野において専門的知識を持ち、研究、収集、分析、企画などを行うプロの呼称として、聞く機会も増えてきました。
したがって、競艇予想に関するあたるあらゆる情報を集め、整理・分析し、提供します。
「美術館」における「キュレーター」は企画展示を成功させるために手を尽くしますが、
「競艇予想」における「キュレーター」は舟券勝負を成功させるために手を尽くします。
他の記事でも再三申し上げていますが、競艇は予想要素もレース数も多いので、人力で網羅的に対峙することは不可能と言えます。ましてや、機械学習等で、過去数十万Rを数千、数万の特徴量(予想要素)で分析され、紡ぎだされた投票がある中で、どうやって勝っていけば良いのでしょう。
テラ銭を25%差し引かれた払戻原資を、AI、本場のおじさん、ギャン中、得体の知れない大口、これらの坩堝のなかでいかに勝ち取るかは、質の高い情報による冷静な勝負判断と資金管理にかかっています。
私黒猫が提供するツールのベースはオープンデータであると申し上げました。ベースはそうですが、他の参加者をリードする手間と工夫を徹底的に行っています。ぜひ、使ってやって欲しいと思うのです。
テラ銭25%を乗り超え、他の投票を出し抜き、プラス収支を勝ち取りましょう。競艇は面白い。ちゃんと勝って、さらに面白い。
そんなココロでやっておりますので、宜しくお付き合いください。
さて、本題の新ツールです。
ツール名なんてどうでもよいことなのかもしれませんが「ST大全」(すたーとたいぜん)と名付けました。
気の利いた名前があれば、教えてください。走り出すにあたり、名前についての納得度は6割くらいです。
公営競技の中で動きながらスタートを切るのは「競艇」だけです。
スタートの瞬間から優勢、劣勢が決まるのです。そして、それは結果を決める最も重要な瞬間である1S1Mの攻防に非常に大きな影響を与えます。
なので、「スタート」を制したい。
そのレースに出場するメンバーのスタート特性を知り、本番スタートで何が起きうるのかの予想につなげたい。それに応える「ST大全」です。
ツールのポイントは3つです。
1つ目は、「選手艇番別データ」による(展示・本番)スタート分布の見える化です。
1号艇出場時と4号艇出場時をまぜて集計したスタートデータに意味はあるのでしょうか。やはり、切り分けて観測した方がより精度が上がるでしょう。その為、「観艇望気」などと同様の手法ですが、「○○選手の〇号艇」という視点で集計を行いました。
そして「スタート分布」です。当たり前ですが、選手によってスタートの上手さは違います。
「.1台」を安定的に出す選手、「.0台」もどんどん出す選手、スタートタイミングがロト状態の選手。速いけど、たまにドカ遅れする選手。
これらの選手特徴を一目で表したいと考えて、指数として分かりやすく表現しました。
(「0.5」より遅れたスタートとフライングを除く)全スタートに占める、各種スタートの割合で求めた3指数が、
「踏込みST指数」、「そこそこST指数」、「ドカ遅れ指数」です。
「踏込みST指数」は「.0台」スタート率、「そこそこST指数」は「.0台」含む「.1」より早いスタート率、
「ドカ遅れ指数」は「.3台」以下のスタート率を表しています。
このほか、「STばらつき指数」として、本番や展示のSTの「ばらつき」を指数化しており、
これは値が大きいほど、スタートにばらつきがあるということを示します。
ここで注意したいのは、「ばらつきが大きい」ことは必ずしも悪いことではないということです。
時にスタート踏み込めることも含めたばらつきなので、平均値や中央値と合わせて評価し、特徴の一つとして捉えてください。
2つ目は、「平均STタイミング」を見て脳死していませんか?という点。
予想に際し、ある選手のスタート特徴を知りたい。真っ当です。
平均STは0.12か。速いな、よし。これはよろしくない。
「平均」の持つ危うさを知っていますか。
真っ向から否定しているのではありません。7,8割あるいはそれ以上、スタートの速さは「平均」で表現できていると思います。
ただし、テラ銭25%を乗り越えて勝たなければいけない私たちは、もっとデータに貪欲にならなければいけません。
そこで、「平均値」だけではなく、「中央値」でも見ておきましょうという提案です。
この提案は、私が急に言い始めたのではなく、競艇に限らず世の中で手垢にまみれた視点です。最も聞きなじみがあるのは「平均貯蓄」はウソだ!でしょうか。細かな説明は、探せばいくらでもあるので、ひとつ参考解説をリンクしておきます。
私たちの興味に照らせば、“ある日の「ドカ遅れ」に数字が引っ張られるのを避けられる”とシンプル化しておきます。
10走したらほぼ、0.12にビタでくるのか。0.02あり、0.20ありの0.12なのか。」そんな視点で、「中央値集計」と1点目の「スタート分布の見える化」を実装しました。
3つ目です。これは私自身のモヤモヤを具現化したもの。
展示におけるSTタイミングと本番におけるSTタイミングに関係性はあるのか。という艇界七不思議。
「ありそうだけど人によるんだろうな」と何の根拠もなく結論付けてきましたが、もう、「見える化」してしまいましょう。
過去のレースのそれぞれのSTタイミングの組合せをプロットしました。中央部の青い点たちです。
この散布図で選手のスタート特徴に手触り感が出てこないでしょうか。さらに、「相関係数」も求め、値に応じて相関コメントを表示しています。
展示が速ければ、本番も速い。展示が遅ければ、本番も遅い傾向にある場合が、正の相関。
展示が早ければ、本番は遅い。展示が遅ければ、本番は速い傾向にある場合が、負の相関。
相関無し、弱い相関あり、相関あり、強い相関ありの7段階評価になっています。
以上が、新ツール「ST大全」のポイントです。
提供方法は模索しますが、日々、新しい競争成績で更新しながら提供する準備は整っています。ちなみに、集計範囲は「観艇望気」等と同様に、2020年度以降としています。何年も遡ることは可能ですが、現時点では、あまり意味のないことかなと評価しています。
みなさまの勝負判断の一助となることを願って。
また、ここまでのご拝読に感謝して。
黒猫合唱団事務局 拝
ここまで、スクロールしてくださった方へ。
折角なので白井選手の2~5号艇分を載せて、締めさせていただきます。(投稿日現在。)
この記事が気に入ったらサポートをしてみませんか?