![見出し画像](https://assets.st-note.com/production/uploads/images/37977263/rectangle_large_type_2_d3c8ca3b5aa5aaa5e6a041bbc81b2ad9.png?width=1200)
プロ野球選手はここ10年で体つきは変化しているのか?BMIを統計的に検定してみたら肥満傾向に!?
野球選手と言うとにメジャーリーグ、プロ野球問わずほかの競技に比べ、体型がぽっちゃりしている印象があったりします。
実際にBMI値を見ても、ここ25年間BMI値が25以上の選手がなんと80%もいるのです。
(参考:https://promea2014.com/blog/?p=2095)
しかし、最近活躍している選手を見ると、山田哲人選手や巨人の坂本選手、柳田選手などアスリート体型の選手も多くなった気もします。
そこで、2009年のプロ野球選手のプロフィールデータと2019年のプロ野球選手のプロフィールデータを用いてBMI値に違いがあったのか統計的に調査してみます。
※この分析は野球でデータ分析することの面白さを重視した内容です。
分析結果が必ずしも全て正しいことはいえませんのでご了承ください。
野球データで楽しんでもらえれば幸いです。
2009年のBMIと2019年のBMIの分布を見ると増えてるように見える
まずは、2009年のBMIと2009年のBMIをヒストグラムにして見てみましょう。
青色が2019年のヒストグラム、オレンジ色が2009年のヒストグラムです。
かなり重なっている部分が多いです。
2029年の方がサンプル数が多く若干右寄りに見えます。
統計検定をする前に
2つの分布に差が有るか検定をする前に2つの分布が正規分布か確認します。(これも検定するんだけどねw)
まずは視覚的に正規分布かどうか確かめていきます。
Q-Qプロットで確認します。
標準正規分布のスケールを横軸、実際のデータの値を縦軸にしてデータをプロットしていきます。
下のグラフの赤い直線上にデータがプロットされていれば正規分布とみなせます。
赤い直線から外れると正規分布といえなくなります。
2009年のBMI値のQ-Qプロット
2009年のQ-Qプロットを見ていきましょう。
概ね赤い直線上にプロットされていると思われますが端の方で外れています。
これは微妙なラインです。
2019年のBMI値のQ-Qプロット
2019年のBMIのQ-Qプロットを見てみましょう。
2009年の分布と同様に端で外れが大きくなっております。
これもまた微妙です。
2種類のQ-Qプロットを確認しましたが、どちらも微妙です。
赤の直線上に概ねプロットはされておりますが箸がどちらも気になります。
そこで正規分布かを確かめる検定を行なっていきます。
正規分布かどうか検定する
BMIのデータの基が正規分布かどうか判断するために統計検定を行います。
正規分布かどうかの検定にはシャピロ-ウィルク検定を行います。
帰無仮説を正規分布であると仮定します。
今回優位水準は1%(結構厳しい)にします。
統計検定で得られるP値により評価します。
今回の結果は2009年のBMIに対するP値は、
0.00010782604658743367(こんなに少数点以下はいらないw)
2019年のBMIに対するP値は、
1.5184164681159018e-07(こんなに少数点以下はいらないw)
どちらも、P値0.01以下ですので帰無仮説である、BMIの分布が正規分布であることは棄却され(厳密には正規分布の母集団からなる標本であることが棄却されます)、BMIの分布は正規分布でないということが採択されます。
正規分布が仮定できないのでマン・ホイットニーのU検定を用います
正規分布を仮定できないので、2つの分布の差を測る検定は、
マン・ホイットニーのU検定を使用します。
マン・ホイットニーのU検定についてはこちら。
帰無仮説は、2019年と2009年のBMIに差はない。
対立仮説は、2019年と2009年のBMIに差はある。
有意水準は1%とします。
結果のP値は、
4.4160904610984715e-18
となり、有意水準5%をつまり0.05を大きく下回っているので(1%でもよかったですねw)、2009年と2019年のBMIには差はないことを棄却するので、
2009年と2019年のBMIには差があるということになります。
2009年より2019年のプロ野球選手のBMIが高いので、体重または身長が高いことが言えます。
必ずしも長打力が増すわけではありませんが、体重、身長が10年前と比べて高くなっていることから、パワーのポテンシャルが高いのかもしれません。
また2010年後半からフライボールレボリューションと長打を狙うためにゴロよりもフライを打つような流れになっています。
長打を狙うために打つので、パワーが求められることから体格がスリムよりもガタイの良い選手の傾向になっているのかもしれませんね。
一方でBMIの上昇を考えると肥満傾向ということもできます。
まとめ
ここ10年でプロ野球選手の体はBMIが上がったことからガタイの良いまたはパワータイプの傾向になってきている!?
肥満体質になってきているのかも!?
今回の分析プログラムとデータはここに(有料)
今回の分析したプログラムが下からダウンロードできます。
notebookファイルでJupyterNotebook上で使用することができます。
どのようなコードを書いているか気になる方はぜひダウンロードをお願いします。
よろしければサポートをよろしくお願いします。サポートいただいた資金は活動費に使わせていただきます。