見出し画像

ボツネタを供養したい その1

主旨

 今回はいつものStatcastデータの分析ではなく、別のデータ分析で使おうと思っていたけれどボツになったものを供養も兼ねてここにアップしておこうと思います。

野球データの公開範囲

 現在は様々な野球のデータが公開され、利用することができるようになっています。とはいえ、全てのデータが公開されているわけではありません。データを集めるにもコストはかかるので、全部を公開するわけにもいかないのは仕方がありません。

 特に守備に関するデータは、指標化された値こそ公開されているものの、その指標の値になるに至った過程のデータを見ることができません。要は生データを利用することができないということです。

Retrosheetのデータが使えるかも?

 MLBのデータを利用することができるサイトにRetrosheetがあります。

 Retrosheetでは過去に遡って試合ごとの記録(Game Log)と打席ごとの記録(Play-by-Play data)をダウンロードして利用することができます。

 この打席ごとの記録(Play-by-Play data)には、hit locationという打球が飛んだ位置を表す変数があります。このhit locationごとに打球の結果を集計すれば、守備の評価のためのデータとして用いることができるのではないか?

そんなふうに考えていた時期が自分にもありました。

 残念ながら、hit locationという変数はあるものの、全ての打球の記録があるわけではないのです。寧ろスカスカといっても良いくらいしかデータはありませんでした。残念ながらPlay-by-Play dataを用いて守備評価用のデータを作ろうというアイデアはここで頓挫しました。

供養

 というわけで計画の頓挫にともない、使われないことになった素材をここにあげておきたいと思います。

 今回は、このPlay-by-Play dataのhit locationを表す図になります。

 Retrosheetにはこのhit locationを表す図として以下のリンクのような図が用意されています。

 この図ですが、ちょっと可読性が悪いと思ったので、図をトレースしフォントを調整してみました。素人のトレースですが、元の図よりは見易くなったと思います。以下にアップしておきますので、もしかして必要な人がいれば保存などして使ってください。

画像1

 ペイントツールなど使って色分けするなら、領域の区分は実線のほうが良いかと思い2パターン作りました。

画像2

 この図を作る前にデータをよく確認しておけば、わざわざ作る必要のないものでしたが、気にしない気にしない。

 こんな感じで考えていた計画がダメになるということは個人的には珍しいことではないです。というわけで、しまっておくだけでは少しもったいない情報はこうして今後もアップしておこうと思います。

今日は簡単ですがここまで

画像:いらすとや

いいなと思ったら応援しよう!