新しいスタッツを作ってみよう サーブの得失点の重み
しばらく寄り道が続いていましたが、今回は本題のサーブ効果率の再構築に戻りたいと思います。といっても、1回でポンと新しいスタッツができるようなものでもなく、部品を1つずついじっていくことになります。
今回のテーマはサーブ効果率の中の得点と失点、つまり“サービスエース”と“サーブミス”について分析します。
現行の指標から見る得失点の重み
まずは現行のサーブ効果率の計算式を以下に示します。
今回のテーマである“サービスエース”と“サーブミス”には、計算式の中でそれぞれ100と25の係数が掛けられています。
この係数は、『1本のサービスエースは、サーブミス4本分の価値がある』ということを意味しています。
この価値の設定は妥当なのでしょうか?
サービスエースとミスの比率は1:4くらいが望ましいとどこかで聞いたことがあるのですが、おそらくそれを反映したものではないかと思います。しかし、これは経験的なもので、サービスエースとミスの価値を実際に検証してみたという報告は上がっていないと思います。ここに、サーブ効果率の再構築の余地があると考えました。
サーブの得失点の価値とは
では、サーブの得点と失点の価値とは何か?を考えるに、サーブだけを切り取るのではなく、
サーブから始まるラリーにおける得点と失点
と捉えることができると思います。
サービスエースによる得点と失点と、その後のラリーによる得点に失点に何か特別な違いがあるような報告は特にありません。なので、この企画ではこれを同じものと捉え、サーブから始まるラリーにおける得点と失点による勝敗への影響を、サーブの得点と失点の勝敗への効果と考えます。
ただし、バレーボールではこの手の研究はまだまだ進んでおらず、今後この考えが覆る可能性はあります。例えば、サービスエースが1本入ると、その後のラリーからブレイクした場合よりも勝率が高くなるといったことが証明された場合は、サービスエースの価値を見直す必要が生じます。
サーブから始まるラリーでの得点と失点と勝敗の関係
それでは、サーブから始まるラリーでの得点と失点と勝敗の関係を統計的に求めてみたいと思います。今回は例として、Vリーグ2017/18、2018/19シーズンより男子1部(プレミアリーグ・VLEAGUE Division1)のデータから、以下のモデルを分析します。
少々面倒な式かもしれませんが、要はサーブから始まるラリーでの得点(ブレイク)と失点(被サイドアウト)でどれだけ勝敗が左右されるかというものになります。この分析の結果から、B1とB2という係数を得ることができますが、これをサーブの得点と失点の価値として使うことはできないだろうかと考えたわけです。
分析の結果は、以下のようになります。
色を付けている部分がモデルの係数の値になります。この結果の中でおかしな部分が1つあります(後述しますが、よくよく考えるとおかしなことはないのですが……)。
それは、被サイドアウト(B2)の係数が0より大きいことです。被サイドアウト、つまりサーブから始まるラリーで失点した場合、勝敗にとっては当然マイナスで、係数も0より小さいマイナスの値となるのが自然であると考えます。しかし、上記の分析結果は、サーブからのラリーで失点するほど勝利する確率が高くなることを意味しています。
表に出てこないミス
データを分析していると、時にこうした常識的に考えるとおかしい結果というものがでてきます。時としてこれが常識を覆すような大発見につながります。しかし、大発見というのは稀で、大抵は何か思い違いをしていて妙な結果になっているものです。
バカバカしい話かもしれませんが、今回の主題はここです。分析していたら妙な結果になってしまった。その原因をよくよく考えようという話です。
こういった妙な結果は、完成品にはわざわざ載せる必要のない情報ですので、表では見ることのない情報ですが、データを分析しているとしばしば遭遇するので対処が必要です。
というわけで、なぜこのような結果となったかを考えるに、「そもそもサーブを打つ権利を得ていなくては、サーブミスは生まれない」という当たり前の事実に行き当たりました。
つまり、サーブミスが多いということは、サーブを打つ権利を多く得ており、これはレセプションから始まるラリーでの得点(サイドアウト)か、サーブから始まるラリーでの得点(ブレイク)が多いことを意味します。これとサーブミスによるマイナスの効果が相殺しても、勝敗にとってはプラスとなったために上記のような結果となったと考えられます。
したがって、サーブミスの得点と失点の勝敗への影響を検証するためのデータとして、サーブから始まるラリーでの失点は適していなかったということになります。
モデルの修正
こういう時は路線の修正が必要です。今回は、以下に示すようにサーブから始まるラリーでの失点(被サイドアウト)を、セプションから始まるラリーでの得点(サイドアウト)に修正したいと思います。
このモデルの場合、サイドアウトが増えても勝利確率は増えますが、この結果をマイナスにすれば、サーブから始まるラリーでの失点に相当するだろうと考えます。結果は以下のようになります。
まぁこんなものかなという結果です。今後はこの結果を使っていこうかと思いますが、この係数をサーブ効果率の計算式に直接投入するかどうかは、後の分析との関係を見ながら検証することになるので今の段階ではここで止めておきます。
まとめ
以上、教訓的な内容にしたくて故意に変なデータを選んだわけではなく、分析したら妙な結果になったので、試行錯誤も晒すことがこの企画の目的でもあるので、一連の分析結果を紹介しました。
後からよくよく考えればわかることですが、よくよく考えたらわかることであれば、事前によく考えてから分析すべきでは?と思った人はいないでしょうか?大正解です。
しかし、司馬遼太郎が確か坂の上の雲で「人は既に起きてしまったことを語るときには神になることができる。」と書いていたと記憶しています。逆に言えば、まだ起こっていないことに対し、神様のように事前にお見通しというわけにはいかないのです。
世に流通している見事なデータ分析の陰には、こうした闇に葬られたしょうもないミスが多々あります。ミスをミスと見つけて軌道を修正することも、立派なスキルです。ケースバイケースにはなりますが、ぜひ身に着けてほしいスキルです。
次回は、サーブの“効果”に関わる部分をどう評価すべきか?というテーマに入ろうと考えています。直接得点にはつながらないので、扱いの難しいテーマになります。
タイトル画像:いらすとや
この記事が気に入ったらサポートをしてみませんか?