マガジンのカバー画像

プロ野球をデータ分析するってよ!

67
プロ野球の選手やチームをデータ分析していくマガジンです。野球を違った視点で見てみたい。野球のデータ分析を見てみたい。気になる選手やチームをデータで見てみたい人に向けたマガジンです。
マガジン購読のほうが5記事以上読む場合はお得になります。 野球を違った視点で見てみたい。 野球のデ… もっと詳しく
¥500
運営しているクリエイター

#python

各球団の年齢層を可視化して分析する

プロ野球が開幕して早くも1か月が経ちました。 各球団の選手の年齢層を可視化して分析します。 各球団のプロフィールデータをスクレイピングしてデータを可視化します。 スクレイピングサイトはお馴染みのこちらです。 ライブラリをインポートimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline URL作成スクレイピングするサイトにアクセスするためのURL文

有料
100

今年のオープン戦投手成績をスクレイピングしていく!

2024年プロ野球開幕まであと少しですね。 オープン戦がおかなわれています。 本記事では、2024年のオープン戦の成績データを全球団スクレイピングする方法を紹介します。 ※スクレイピングする際はサイトに負荷をかけないこと、サイトの規程等に従い行いましょう。 今回スクレイピングするサイトはこちらです。 1. インポート使用するライブラリをインポートします。 import pandas as pdimport seaborn as snsimport time as ti

有料
200

プロ野球の試合の観客数データを35行のコードで取得する2023年版

はじめに 2023年もあとプロ野球は日本シリーズを残すのみになりました。 今年は関西対決で大いに盛り上がっていることでしょう。 今回は各球団のプロ野球の試合の観客数を14年分(2009年〜2022年)取得します。 データ取得元データ取得元は、プロ野球Freakさんです。 いつもお世話になっています。! スクレイピングコード全体コードの全体は以下です。 scrape関数はその名の通りスクレイピングの処理をします。 urlにスクレイピングするサイトのURL、yearは年の

有料
100〜
割引あり

プロ野球選手の能力を評価するプログラム構築手順書

前書き(長いw)セイバーメトリクスなど野球選手の定量的、統計的な評価の仕方ができてだいぶ経ちます。 数値で評価できることは比較がしやすく、感覚的になんとなくの評価が少なくなり、選手の能力評価に良い側面があります。 もちろん感覚的な部分の評価も重要でデータでは測れない部分の能力をもつけることも重要です。 どちらかではなく、バランスです。 定量的に評価する部分では、セイバーメトリクスでは様々な割合だったり、数値が出てきます。 ぱっと見ても分かりにくい指標があったりします。 簡単

有料
400〜
割引あり

WBC日本代表山田哲人選手を分析してみた

WBC開幕まであと2週間に迫りました。 WBC日本代表のデータ分析をしていきたいと思います。 背番号1ということで最初の選手の分析は山田選手です。 評価基準選手総合評価を以下のように行います。 項目はミート、パワー、得点力、走力、選球眼、運の6種類です。 6種類の評価基準はそれぞれセイバーメトリクスよりレベル0から6にランク付します。 レベル6はセイバーメトリクスの指標上超一流レベルですので、まさに某禁書目録でいうレベル6でしょうw OPS:打率+出塁率 得点力 ランク

有料
100
+3

プロ野球セ・リーグ、パ・リーグ別2022年球場来場者データ

この記事はマガジンを購入した人だけが読めます

40行で13年の全球団の動員数をスクレイピングする

プロ野球選手の成績をよくとっていますが、選手のデータだけがデータじゃない!(ぇ 今回は各球団の球場の来場者数をスクレイピングします。 ※スクレイピングを行うので過剰なアクセスは気をつけましょう 今回のプログラムは主に3つの部分に分かれます。 ライブラリインポートでは今回使うライブラリのインポートをします。 スクレイピング関数では、アクセスしたURLで取ってきたデータを加工する処理を関数にまとめています。 メイン処理では、各チーム、各年ごとURLが分かれているので、URLを文

有料
200

30行でスタメンデータを集計してデータフレームにまとめる

前回スタメンデータをスクレイピングして各打順ごとの出場回数を集計してグラフにしました。 グラフにしてみることがメインでしたので、集計してそのまま可視化していましたが、選手が各打順で出場回数が何回か見たいこともあると思います。 また、なによりもデータとして持てる形にしておきたいことも多いです。 そこで、今回はプロ野球のスタメンデータを使って、各選手(1軍で出場機会があった選手)の打順ごとの出場回数をデータフレーム形式で持つようにします。 ライブラリをインポートimport p

有料
100

8行で完了!プロ野球スタメン打順集計

プロ野球スタメン打順データを集計して、今シーズン(2022年8月20日時点)の打順別出場数を見ていきたいと思います。 ライブラリをインポート今回はデータの加工と可視化に使うpandasとmatplotlibを利用します。 ライブラリをimportしていきます。 import pandas as pdimport matplotlib.pyplot as plt%matplotlib inline データ読み込みスタメンデータを読み込みます。 データは下の記事でスクレイピ

有料
100

プロ野球スタメンデータを15行でスクレイピングする

プロ野球のスタメンデータをスクレイピングします。 毎度お世話になっているプロ野球フリークさんにはスタメンデータがあり、各試合の1番〜9番までのスタメンが記録されています。 今回はこのデータをスクレイピングして、各球団のスタメンデータを15行で作成します。 ライブラリをインポートまずは今回使うライブラリをインポートします。 import pandas as pdimport matplotlib.pyplot as plt%matplotlib inline URL作成ス

有料
150

pycaretで簡単プロ野球選手の年俸を機械学習で予測する

概要機械学習やデータ分析するのにscikit-learnを使って学習して予測するのはいくらライブラリで楽になったとしても、 初心者にはややハードルが高いですね。 今はAUTOMLといった自動で複数の機械学習アルゴリズムを試せます。 2〜3年前は製品としてしかなく、無料で行うことはできませんでした。 しかし、今となってはpythonのライブラリで可能です。 今回はpycaretというライブラリを用いて、機械学習によるプロ野球年俸予測を行います。 環境私の実行環境は以下になり

有料
300

25行で大谷さんの2021年シーズンの毎試合の成績をスクレイピングする

9月も終わり、メジャーリーグ、プロ野球も終盤です。 野球のデータとなると年単位などある程度データ数が必要で、データの取り方も年単位の成績データで持つことが多いです。 しかし、毎日の試合の成績をデータとして持ちたい、そこからデータを加工したいと言うこともあると思います。 今回は、今シーズン、9月8日時点でホームラン数トップを走って大活躍の大谷選手の2021年の毎試合の成績をスクレイピングします。 (コードはホームページからのデータから取りにかかるので、最新のデータが取ることがで

有料
100

松坂大輔投手データ分析

概要今季限りで引退を表明した松坂投手。 平成の怪物として当時は150km/hを超える投手がいない中で高校生最速の155km/hを叩き出し、甲子園優勝にも輝きました。 惜しくも今シーズンで引退を表明することになり、世代の移り変わりを感じます。 松坂世代と言われていた選手たちも次々と引退していく中でついに松坂投手の引退となりました。 そこで、今日は松坂投手のこれまでの活躍をデータ分析で見ていこうと思います。 記事は、html形式でjupyter notebookのコードともに載

有料
300

プロ野球先発投手データを14行のコードで取得する

野球は投手が8割といわれるほど重要なポジションです。(諸説ありますし、何が重要かは人それぞれです。) 先発投手のデータを取得して分析していこうと思います。 まずはデータを取得するところからになります。(えぇ・・・ だってデータがないと始まらないのですもの。 それでは 14行のコードで取得できます!14行でプロ野球12球団の今シーズンの先発データを取得できます。 import pandas as pdimport timeif __name__ == '__main__'

有料
200