見出し画像

【最終回】"忖度ゾーン" を考慮した簡易フレーミング評価の検討

 このnoteは3部構成の3つめ。いよいよラストです。前回前々回を読んでないよという方はサラッとでも参照して頂けますと幸いです。まあこのnoteのサビはここだと思うので時間がない方、これ以上読む字を増やしたくない方はこれだけでもって感じですね。そもそもここまでの2つを読んでない人がこのnoteに辿り着くとは思えないのですけれども。

 前回までで指標の算出はおしまい。今回は総括として、現時点で予想される指標の問題点や来季以降試みる改善方法について書いていきます。

6. LFrameの限界・指標としての位置づけ

 トピックは以下の通り。一つひとつにそこそこボリュームがありますし、皆さんだいぶ飽きてきていらっしゃると思うので、これはと思ったポイントに目を通して頂ければと思います。

①算出プロセスの問題点
②効果量の検証ができない・順序統計量としての不十分さ
③MLBとの比較
④他の指標への応用可能性

①算出プロセスの問題点
 まずは指標の算出方法そのものに係る問題点。最も重要な問題として、算出された数値がいわゆる専属捕手制に弱いというポイントがあります。

 専属捕手制とは、先発ローテーションの中で、特定の投手が先発する時だけいわゆるバックアップの捕手が先発出場するシステムです。打てる捕手の台頭による打席数増加やレギュラーシーズンの出場負担の重視に伴う積極的な休養システムの浸透により、多くのチームで捕手起用にも多様化が見られるようになりました。NPBのローテは中6日が基本なので、控え捕手と相性のいい先発投手1人を選んで先発日を合わせるように起用すれば、投げる方も誰と組むのか予測しやすく、捕手が入れ替わることによる余計なコストを生みにくいという利点が考えられます。

 ところが、フレーミング評価を定量化する上ではこれが問題点にもなります。一般的な線形回帰のモデルでは、説明変数、すなわちバッテリーの組み合わせがランダムに決定される(毎日投手と捕手をくじ引きで決める)ことを仮定しています。もちろんこの仮定を完全に満たすのは不可能ですが、特に問題になるのはバッテリーが完全に固定されてしまっている場合。専属捕手で週1回1人の投手とだけ組んで、投手が降板するとそのままバッテリーごと交代するようなシステムを採用しているときには、捕手に対する評価が投手のそれと識別できないという弱点が生じます。例えば、もともとコマンドに対する評価が低く、ゾーンの境界付近に行ったボールを取ってもらいにくい投手がいて、その投手と特定の捕手が専属バッテリーを組むような場合は、評価値にバイアスが含まれやすくなります。降板後もリリーフ投手を受けるような場合はこの問題もある程度解消されますが、まあ「ちゃんと全投手とランダムで組ませろ」などと言うことができるわけでもないので、ここはこの算出方法に限らないフレーミング評価の問題点だと思います。

 また、この評価方法のキモである「ゾーンの境界」の定義についても議論の余地があります。今回はサンプルを絞り込むためのゾーンの境界の条件を、プロットされたデータを元にぼく自身が恣意的に絞り込むという方法を取っています。方法の項で議論した通り、絞り込みにあたって考える仮定は「このゾーンの中に入った投球は(平均的に)ほぼ同じ位置に投げられたボールである」なので、これが崩れてしまうと算出に使えない投球データを含んでしまったり、あるいはより精確な算出の役に立つ情報を無視してしまう可能性が生じます。何らかの統計的手法でサンプルの絞り込みルールを確立できれば…というところですが、現状はいわばなんとなくで絞り込みを行っていることになります。

②効果量の検証ができない
 2点目は効果量、すなわち「誰と誰のフレーミングにどれぐらい差があるのか」について。今回提示した評価方法は、不精確な投球の位置情報データを逆手に取り、捕手によってコールが変わった、すなわちフレーミングの効果が大きかった投球を抜き出して分析を行っています。抜き出したサンプルを使った分析で評価を数値化しても、その捕手が明らかなストライク/ボールゾーンにプロットされた投球も含めて生み出す貢献については議論できないという問題があります。ゾーン際でストライクを取る能力はそれ以外のゾーンでそうする能力とある程度相関していると思われますが、後者を直接推定することができないことで分析にノイズが入る可能性が考えられるということです。

 これを踏まえると、結果をランキング形式で発表するのもあまりベターな方法とは言えないでしょう。スコアに大きな開きがある選手間はまだしも、差が小さな選手間では明確に「○○捕手より××捕手の方がストライクを取れる」と言い切ることをせず、「上位・中位・下位集団」ぐらいの見方でざっくり分析した上で、直接動画等を参照しながら技術的な部分を補足するのが正しい見方かと思います。

これについてはその他の指標でも同じことが言えるでしょう。UZRが、WARがわずかでも高いことと、高い方の選手が優れた能力を持っていることは分けて考えるべきだと思います。

④MLBと比較可能な技術としてのフレーミングが浸透しきっていない可能性

 これはこの指標の算出方法に止まらない、「NPBのフレーミング」に関する議論です。MLBでは精確な座標データを元に算出されたより信頼度の高いフレーミング評価指標の考案が進んできましたが、NPBはその技術的な評価の枠組み自体がそのMLBと異なる、という可能性です。

 フレーミングが捕手の技術の一つとして認知されており「こういうフレーミングが上手い」「こうすべきでない」という評価軸が存在するMLBと、「ミットは捕球位置で止めるべき」という指導が基本で、フレーミングに対して否定的な見解が現在でも一定割合を占めるNPBとを比較すると、物理的には全く同一の技術が球審のコールに対して異なる影響を与える可能性があります。キャッチャーがボールを収める際に見えた小さなミットの動きに対して、「高い技術の表れだ」という印象を持つか「ミットずらし」と受け取るかでは(たとえ意図的ではないとしても)手の上がり方も変わってくるでしょう。日米ないし審判団の間で異なる文化が形成される可能性がある、ということです。

 これは最終的に「フレーミングの在り方」そのものの議論にもつながってくると思います。ストライク・ボール判定の機械化がゾーンの定義の厳密化とイコールでないことはこれまでぼくがnoteやTwitterで議論してきた通りですが、その議論の中で欠かすことができないのがフレーミングの部分。現在我々が検証している問いのは「フレーミングがどこまで球審のコールに影響を与えうるか」で、ここは分析者の感情が介入し得ない部分です。が、これをより"公平"な形でストライクゾーンの文脈の中に織り込むためには「フレーミングによるコールの変化がどこまで許容されるべきか」という問いに折り合いをつける必要があります。

 「コールはあくまで投球の通過位置のみに基づいて行われるべき」という人もいれば、「ストライクゾーンの曖昧さによって生まれたフレーミングは次世代の野球にも受け継がれていくべき」という意見も認められると思います。個人的には「文脈によってゾーンが変化するのは野球の味として残していきたいが、例えばゾーンにかすりもしない投球がたとえ偶然であれ、ストライクとコールされるのは受け入れがたい」というところ。じゃあ「かすりもしない」って具体的にどこまで?という部分に折り合いをつけていく必要がある。「フレーミングが効くのはここまでだ」という実証的主張ではなく、「フレーミングが効くのはここまでであるべきだ」という規範的主張を戦わせなければならないわけです。もちろん簡単に答えが出る問いではないでしょうが、避けては通れない議論かなと思います。

 まだまだ書けることはあるのですが、現時点で文字数の総計が14,000字を超えるというとんでもないことになっているのでこの辺で筆を置きたいと思います。筆を置くっていう表現もいつまで存在するか分からないですよね。

7. まとめ・指標の拡張可能性

 今回は以上です。この文章を読んで下さっている皆さんはこのク○長文noteを最後までスクロールしてくれたということですね!!ありがとうございます!!!でもこの後が一番大事かも知れません。

 「素人が得られる範囲のデータでどこまでできるか」というテーマは「少なくとも取得出来ていることが我々素人にも分かっているデータソースにアクセスできない」という問題の存在を前提にした目標設定であり、この点は特にNPB、ないし「NPBを観る素人」に特有の悩みでしょう。例えばプロ球団で働くアナリストがこうした問題に対処しようとするのは無意味ですし、またファン視点でも「わざわざ信頼度の低いデータから算出した指標を当てにすることもない」という感覚が生まれるのは自然だと思います。実際このアプローチがセイバーメトリクスを発展させる上でどれぐらいの貢献をなすのかについては未知数ですし、議論の余地がある部分だと思います。

 ぼく自身がその意義の一つとして考えているのは、データの「ダウングレード」に対応できるという点。目視に基づいたデータ取得はトラックマンを用いたそれよりも比較的容易ですが、大きな測定誤差をはらむという問題点があります。これまでのアプローチが信頼できないという場合に、次善の策として持っておける評価メソッドがあれば、精確なトラッキングデータがないからお手上げ、という状況にも陥りにくいと思います。何らかの問題でデータ得られなくなった場合(このご時世なので経済的な問題で縮小されることも考慮しておく必要があるでしょう)、あるいはデータへのアクセスが難しいアマチュアレベルで分析を行う際に「制約を前提にしてどこまでできるか」を考えることには大きな意義があると言えるでしょう。

 これは投球の座標データに限らず、広くアマチュアのデータ分析を行う上で重要なポイントだと思います。ラプソードによる分析ができないなら目視ででも球種ごとのスイング率・コンタクト率を記録しておく試合が少ないなら練習のフリー打撃から打球の強さを測定してみるなど、今すぐにできる範囲を模索することで得られることはかなり多いはずです。データが上から降ってくるものではない、という前提を認識して、必要なものを自ら調達する。その中でできるアプローチを考えるという姿勢を持つことで、チームの分析を前に進める可能性を広げられる、というのが今回の思索から得られるメッセージのコアだと思います。

 長々と失礼しました。ご意見、ご感想を書いてやってもいいよという方は、ぜひこのnoteのコメント欄や筆者の各種SNSにお寄せ頂ければと思います。

おまけ

 読んで下さったお礼にぼくの好きな曲でも貼っておきます。2曲も。
 『なんでもっと』名曲ですよね。自粛期間中は宅録で演奏したり、他のミュージシャンとオンラインでレコーディングをやったりと彼ならではの新しさに挑戦してましたね。ネットの海を利用した視聴環境にマッチするように音質を調整したりと、御年55にして常に最新を追いかけ続ける姿勢には学ぶところが多々あるように思います(だれ)

#野球 #プロ野球 #セイバーメトリクス #NPB #フレーミング #キャッチャー



貨幣の雨に打たれたい