見出し画像

“データサイエンスに必要なのは仮説力だ”読書note109「統計学が見つけた野球の真理」

“最先端のセイバーメトリクスが明らかにしたもの”というサブタイトルがついている。野球に関するビッグデータを駆使して、野球のチーム力や選手個々の力を客観的に示す指標が次々と考えられている。

セイバーメトリクスの「セイバー(saber)」は、「Society for American Baseball Research」の略語で、「アメリカ野球学会」という意味。「メトリクス(metrics)」は、「指標・評価基準」という意味。

http://www.xn--0et88ccz6awh1a.biz/the_term/3513.html

野球がデータを駆使して戦われるようになって久しいが、MLBで活用されている指標を解説し、日本のデータを使ってプロ野球の分析してくれている。

打率、本塁打数、打点といった三冠王で使っている指標は、あるいみ死語とも言える。例えば、打者を評価する「打撃でのチームへの貢献度を測る指標」としてOPS(On-base Plus Sligging)というものが提唱されていて、これは「出塁率+長打率」で計算されている。OPSと得点との相関係数は0.911で、得点と打率の相関係数0.726よりも圧倒的に相関が高くなっている。

これは単純な式になっているが、打者が1打席あたりどれだけ得点創出に貢献しているかを測る、四死球、単打、失策出塁、二塁打、三塁打、本塁打にそれぞれ得点価値をかけて重みづけした数値を加算、打数+四球-敬遠+死球+犠飛で割る、といった複雑な指標wOBA(Weighted On-Base Aveerage)など多くの指標が提唱されている。

ビッグデータを使って、状況別(アウトカウント、出塁状況)別の得点期待値が出せるのだが、これを使って、犠牲バントが本当に有効化を計算することができる。そこで無死一塁の状況下での犠牲バントのの損益分岐点をはじき出すと、出塁率1割2分7厘という数字が出て、2021年のNPBで見ると3名しかおらず、うち2名は投手だということであり、無死一塁ではヒッティングの方が得点期待値を上昇させる戦術であるという答えになる。

自分がこの本を読んで感じた事は、データサイエンスを学ぶ人のための、教科書・参考書として非常に示唆に富んだ本になるのではないかという事。ただ、野球に多少詳しくないと付いていけないのが玉に瑕なのだが、、、

そして、データサイエンス力というのは、決して単なる計算力ではないという事、指標やモデルを構築できる仮説力こそが、求められる力であるという事、それを学べる良書であると思う。

この記事が気に入ったらサポートをしてみませんか?