![見出し画像](https://assets.st-note.com/production/uploads/images/69482594/rectangle_large_type_2_3edf470366cc6bfdc6bb522d8327d75a.jpg?width=800)
これが回帰分析か!!
こんにちはこんばんは。Red Sox担当のRyuです。
MLBのファンならだいたいセイバーメトリクスに興味があると思います(偏見)。そこで、その入門書として有名な「Rによるセイバーメトリクス入門」を途中まで読んでみてどうだったかっていうのを簡単にまとめたいと思います。ちなみに僕はこれまでRに触ったことがほぼありませんでした。
結論から言うとまあ面白いです。基本的な処理さえ覚えてしまえば、重回帰分析を体験できますし、グラフィックスもggplot2を使えば簡単にできます。4章で回帰分析が扱われているのですが、タイトルにもあるように最初実行したときは「こ、これが回帰分析か!!(感動)」ってなりました。
ただ、一つだけ落とし穴(?)があります。
「まずはLahmanから始めよう!!」ということです。
「Rによるセイバーメトリクス入門」では、データセットが主に4つ紹介されています。Lahman、Retrosheet、PITCHf/x、そしてStatcastです。その中でもLahmanはコンソールで
install.packages("Lahman")
library(Lahman)
って実行するだけで使えます。(めちゃくちゃ簡単!!)他のデータセットも魅力的ですが、僕はエラーを多発させて萎えてしまい、まだ全然触れていません。。。
っていうのがほぼ唯一の落とし穴(?)なのですが、Lahmanにも十分データが集まっているので、最初のうちは満足できると思います。まあいずれFryball Revolutionとかの研究をしたいってなったらStatcastは必須になりそうですが。
こんな感じで簡単にまとめてみました。これから始める方の参考になったら幸いです。それでは。
この記事が気に入ったらサポートをしてみませんか?