データを使うと目標の抽象度を下げられるよ、という話
このnoteは、東大野球部に学生スタッフ兼アナリストとして所属する私、齋藤周が、日々の練習内容や気づいたことをメモしておくためのものです。
データの抽象度を下げる
あけましておめでとうございます。野球人生ラストイヤーを迎えました。東大野球部での最後の一年となる今年は、「テクノロジーの力でテクニックの差を覆す」というテーマで取り組んでまいります。
さて今回は、「データの抽象度を下げる」というテーマについて書こうと思います。
近年ではコンピュータの処理能力の向上やディープラーニング技術の浸透などにより、大量のデータを分析して様々な知見を得ることの有効性があがってきました。「Data is the new oil.(データは新しい石油である)」なんて言われているくらいです。
そしてその流れはスポーツにも進出し、最近ではスポーツの世界にもアナリストというポジションが導入されるようになりました。実際に、データを活用している球団は強い、ということが証明されたりもしています。
なので、今後はデータアナリストというポジションがより重要度を増していくのかなー、なんて思ったりしています。
そんなデータアナリストの仕事の中でも、データの抽象度を下げることは特に大切な仕事の1つです。そしてこれは、スポーツに限らず様々な場面で応用のきく考え方ではないかと思っています。
実際に抽象度を下げてみる
例えば、セイバーメトリクスには「ピタゴラス勝率」という概念があります。得点の2乗を、得点の2乗と失点の2乗の和で割ると、大体の勝率が計算できるよ、というものです。
2020秋の東大を例にすると、得点が14、失点が60ですから、
(14*14) / (14*14 + 60*60) = 0.051633...
となります。導き出された2020秋の東大の勝率は約5%です。よって10試合の勝ち点の期待値で言うと、
10 * 0.05 = 0.5
です。実際の2020秋の東大の勝ち点は0.5ですから、ぴったり当たっています。ジャストすぎて、計算した自分でもびっくりしました。
このように、ピタゴラス勝率というモデルはかなり高い精度で当てはまることが知られています。なのでこれを使うと、例えば「シーズン●勝」が目標なら、そのためには「得点●●点、失点●●点を目指そう」というように具体化することができるのですね。これが抽象度を下げるということです。
さらに細かく得点数を掘り下げるなら、
得点数と塁打数は相関が強いので、得点数を上げるには打率アップだけでなく長打を増やす必要がある。
→長打に強い影響を及ぼす因子は打球速度なので、打球速度をあげる必要がある。具体的には、▲▲km以上になると長打が出やすくなる。
→打球速度と相関が強いのはスイングスピードとミートの巧拙。打球速度▲▲kmを打つなら、スイングスピードでいうと◆◆kmくらい必要。
→スイングスピードと除脂肪体重は相関がある。スイングスピード◆◆kmのためには除脂肪体重がだいたい■■kgくらい。
→筋肥大を促すトレーニングでまずは除脂肪体重■■kgを目指そう!
みたいに個人レベルまで抽象度を下げることができます。こうすると、なんとなく達成までの道のりが見えてきた気がします。
「シーズン●勝」みたいな目標だけだと、各個人がどうすれば達成できるのかわかりづらいので、「とりあえず練習してうまくなろう」みたいな発想になりがちなんですが、データを活用して抽象度を下げることで、個々人がどうすればいいかが少しずつはっきりしてくるのです。
このようにデータの抽象度を下げて、目指すべきところをよりクリアに、身近な数値にしていくことが、データアナリストの重要な任務かなと思っています。
そしてこれは、スポーツに限らずあらゆる場面で応用できる考え方な気がします。お正月の間に新年の目標を立てた人も多いと思うので、まずはその抽象度を下げてみるといいかもしれません。
この記事が気に入ったらサポートをしてみませんか?