見出し画像

プロ野球選手の年俸とプロフィールデータを重回帰分析を取った結果

前回プロ野球のプロフィールデータと年俸の相関を分析しました。

今回は重回帰分析をしてその回帰係数から年俸とプロフィールデータの関係を探っていこうと思います。
回帰分析をする場合は、学習したモデルに対して、未知データを与えることで年俸などの予測をしたりするために使います。
今回は未知データがないので、回帰係数を見て分析するだけにとどめます。
シーズン後に契約更改前に成績から年俸を予測して、実際の契約更改と当たるか試してみると面白いかもしれませんね。
これは未来に取っておきましょう。

分析結果

分析結果のサマリは、以下になります。
ポジションはレギュラーに座れる枠とそのポジションの特性からキャッチャーは年俸が低い傾向にあります。

年俸など金額にまつわる回帰分析は対数を取りましょう。
対数を取らないと予測や分析に偏りや誤差の影響が強く受けます。

対数を取って分析した結果、
血液型不明な選手の年俸が高くなる要因となるのは外国人選手だから。
右投両打は希少性から年俸を上げる要素となりえる。
球団で見ると、ソフトバンク、日ハム、横浜が年俸が高い傾向にあります。

使用するデータ

おなじみの?プロ野球freakさんからスクレイピングしたデータを使わせていただきました。

ここから先は

2,579字 / 7画像
この記事のみ ¥ 200

よろしければサポートをよろしくお願いします。サポートいただいた資金は活動費に使わせていただきます。