マガジンのカバー画像

プロ野球をデータ分析するってよ!

67
プロ野球の選手やチームをデータ分析していくマガジンです。野球を違った視点で見てみたい。野球のデータ分析を見てみたい。気になる選手やチームをデータで見てみたい人に向けたマガジンです。
マガジン購読のほうが5記事以上読む場合はお得になります。 野球を違った視点で見てみたい。 野球のデ… もっと詳しく
¥500
運営しているクリエイター

#データ分析

各球団の年齢層を可視化して分析する

プロ野球が開幕して早くも1か月が経ちました。 各球団の選手の年齢層を可視化して分析します。 各球団のプロフィールデータをスクレイピングしてデータを可視化します。 スクレイピングサイトはお馴染みのこちらです。 ライブラリをインポートimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline URL作成スクレイピングするサイトにアクセスするためのURL文

有料
100

WBC日本代表中野拓夢選手を分析する

WBC一次リーグもおわりますね。 今回はWBC日本代表の中野拓夢選手を分析します。 中野拓夢選手評価今年3年目の中野選手です。 WBCメンバーの中ではプロのキャリアが少ないものの、高校、大学、社会人を経てプロ野球選手になっているので即戦力として活躍をしています。 打者のタイプは得点力レベル2、ミート、スピードがレベル3の足が使えるアベレージタイプでしょう。 2年分のデータしかありませんが、OPSは0.6台とまずまず。 今シーズンはIsoDが下がり、選球眼が良くないといっ

有料
100

30行でスタメンデータを集計してデータフレームにまとめる

前回スタメンデータをスクレイピングして各打順ごとの出場回数を集計してグラフにしました。 グラフにしてみることがメインでしたので、集計してそのまま可視化していましたが、選手が各打順で出場回数が何回か見たいこともあると思います。 また、なによりもデータとして持てる形にしておきたいことも多いです。 そこで、今回はプロ野球のスタメンデータを使って、各選手(1軍で出場機会があった選手)の打順ごとの出場回数をデータフレーム形式で持つようにします。 ライブラリをインポートimport p

有料
100

8行で完了!プロ野球スタメン打順集計

プロ野球スタメン打順データを集計して、今シーズン(2022年8月20日時点)の打順別出場数を見ていきたいと思います。 ライブラリをインポート今回はデータの加工と可視化に使うpandasとmatplotlibを利用します。 ライブラリをimportしていきます。 import pandas as pdimport matplotlib.pyplot as plt%matplotlib inline データ読み込みスタメンデータを読み込みます。 データは下の記事でスクレイピ

有料
100

pycaretで簡単プロ野球選手の年俸を機械学習で予測する

概要機械学習やデータ分析するのにscikit-learnを使って学習して予測するのはいくらライブラリで楽になったとしても、 初心者にはややハードルが高いですね。 今はAUTOMLといった自動で複数の機械学習アルゴリズムを試せます。 2〜3年前は製品としてしかなく、無料で行うことはできませんでした。 しかし、今となってはpythonのライブラリで可能です。 今回はpycaretというライブラリを用いて、機械学習によるプロ野球年俸予測を行います。 環境私の実行環境は以下になり

有料
300

松坂大輔投手データ分析

概要今季限りで引退を表明した松坂投手。 平成の怪物として当時は150km/hを超える投手がいない中で高校生最速の155km/hを叩き出し、甲子園優勝にも輝きました。 惜しくも今シーズンで引退を表明することになり、世代の移り変わりを感じます。 松坂世代と言われていた選手たちも次々と引退していく中でついに松坂投手の引退となりました。 そこで、今日は松坂投手のこれまでの活躍をデータ分析で見ていこうと思います。 記事は、html形式でjupyter notebookのコードともに載

有料
300

プロ野球先発投手データを14行のコードで取得する

野球は投手が8割といわれるほど重要なポジションです。(諸説ありますし、何が重要かは人それぞれです。) 先発投手のデータを取得して分析していこうと思います。 まずはデータを取得するところからになります。(えぇ・・・ だってデータがないと始まらないのですもの。 それでは 14行のコードで取得できます!14行でプロ野球12球団の今シーズンの先発データを取得できます。 import pandas as pdimport timeif __name__ == '__main__'

有料
200

杉谷拳士選手に打率を統計的に分析したらリアルすぎた

※この分析は野球でデータ分析することの面白さを重視した内容です。  分析結果が必ずしも全て正しいことはいえませんのでご了承ください。  野球データで楽しんでもらえれば幸いです。 プロ野球もシーズンが終わりに近づいてきました。 今年も杉谷選手はたくさんの笑いと感動を与えてくれました。 杉谷選手はそのパフォーマンスから知名度は高い?ですが、本来のポテンシャルが気になるところです。 そこで、今回は野手ではまず目を向ける打率について統計的に分析します。 分析内容野手の成績には数多

有料
200

20年間の感動をありがとう!岩隈投手をデータ分析したら安定の岩隈選手でした

10月19日20年間のキャリアにて野球選手としての人生を終えました。 MLBから戻ってきてのNPBでの活躍を期待していましたが、惜しくも引退となりました。 それでも、多くの活躍と感動を与えてくれました。 岩隈投手が先発の時にMLBの1球速法をバックグラウンドでつけながら仕事をしていたのも懐かしいです。(やめぃ) 今回は岩隈投手のデータ分析をしていきます。 基本情報1999年ドラフト5位で近鉄に入り、楽天に移りました。 楽天ではエースとして活躍し、2012年よりマリナーズに移

有料
200

今年度の年俸を機械学習に予想させるために2018年までのデータから2019年の年俸を予測させてみた(野手編)

プロ野球の年俸はシーズンが終わると連日のニュースで話題ですね。 まだ9月で契約更改の季節ではないですが、2018年までの過去データを用いて、2019年の年俸を予測し、持っているデータの結果と比較して、精度を見ていきます。 今回の記事で作成した年俸予測モデルは2020年のシーズンが終わったら、2020年の成績データを予測にして、実際の年俸結果をどれだけ当てられるか試していきたいと思います。 使用するデータ2009年から2019年のプロ野球成績データを使います。 今回は2009

有料
400

異例の3軍行きの澤村選手に何が起きた!?をデータから考える

巨人の澤村選手が3軍行きになったことがニュース記事に報じられました。 澤村選手というと大学では史上最高の球速156㎞/hをたたきだす偉業も成し遂げ、プロに入ってもその力のあるストレートは健在です。 さらに変化球もスライダー、スプリット、カーブのキレも抜群でスプリットはストレートと見分けがつかず、強力な球種の持ち主です。 高い能力を持ちますが、3軍に落ちてしまった澤村選手をデータから見ていこうと思います。 データでは澤村選手はどう映るのかを分析していきたいと思います。 投

有料
100

プロ野球開幕投手エース分析!今季好調大野雄大選手を分析する

開幕からもう2ヶ月、試合数も折り返しが来ていますが気にせず開幕投手分析は続けていきますw 大野雄大選手の分析でちょうどセ・リーグ全員の開幕投手分析を始めて、ちょうど折り返しになります。 今日分析する大野雄大選手は今季既に3完投しており、なかなか好調のシーズンです。 そんな大野雄大選手のこれまでの成績を見てきます。 2018年先発ローテーションに外れたものの返り咲いたエース 大野選手は2011年中日ドラゴンズに入団したサウスポーです。 2010年ドラフト1位と有望選手とし

有料
100

10年間のプロ野球選手成績データをマージするぞ!

前回プロ野球成績データを片っ端からデータ取得しました。 このままでは複数のファイルですので分析をする上では扱いづらいです。 今回は取得したデータを加工して、分析のためのデータの持ち方にしようと思います。 前回は投手は2つのデータセット、野手は3つのデータセットを取りました。 年収データセットもマージして、分析用のデータを野手用と投手用の2種類を作成します。 データの取得に関する記事は以下になりますので興味ある方はぜひ! 全体の流れ処理の流れは前回取ったデータを読み込み、マ

有料
100

プロ野球選手のプロフィールデータをいっきに10年分取得してみた

前回プロ野球選手の成績データを10年分スクレイピングしました。 前回スクレイピングしたデータセットは主に成績データになります。 プロ野球選手のデータには推定年俸や身長、体重、出身、年齢といったプロフィールデータもあると何か特徴を捉える助けになるかもしれません。 そこで今回は、プロ野球選手のプロフィールデータを10年分、全チームスクレイピングします。 前回のプロ野球選手成績データの記事は以下になります。 こちらの記事では成績データを10年分をとるための方法が記載されていますの

有料
200