マガジンのカバー画像

プロ野球をデータ分析するってよ!

69
プロ野球の選手やチームをデータ分析していくマガジンです。野球を違った視点で見てみたい。野球のデータ分析を見てみたい。気になる選手やチームをデータで見てみたい人に向けたマガジンです。
マガジン購読のほうが5記事以上読む場合はお得になります。 野球を違った視点で見てみたい。 野球のデ…
¥500
運営しているクリエイター

#スクレイピング

10行でセ・パ両リーグの球団成績をスクレイピングして可視化する

早くも前半戦が終わりました。 今回は球団の成績をセ・パ両リーグスクレイピングしてマージします。 マージした後そのデータを使って簡単に可視化します。 1. インポート使用するライブラリをインポートします。 スクレイピングで使用するライブラリはpandasです。 可視化にはmatplotlibとseabornを使用します。 In [14]: import pandas as pdimport matplotlib.pyplot as pltimport seaborn as

¥100〜
割引あり

関数にして10行で2024年セ・パ交流戦成績データをスクレイピングする。

2024年もこの季節がやってきました。 セ・パ交流戦! プロ野球公式サイトに交流戦の成績のデータも記録されています。 このデータをスクレイピングして使いやすい形に整形していきたいと思います。 サムネイル用の画像はnaofujisawaさんよりnoteから使わせていただきました。ありがとうございます。 1. インポートpandasをインポートします。 import pandas as pd 2. データ取得サイトからデータを取得します。 df = pd.read_ht

¥100〜
割引あり

各球団の年齢層を可視化して分析する

プロ野球が開幕して早くも1か月が経ちました。 各球団の選手の年齢層を可視化して分析します。 各球団のプロフィールデータをスクレイピングしてデータを可視化します。 スクレイピングサイトはお馴染みのこちらです。 ライブラリをインポートimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline URL作成スクレイピングするサイトにアクセスするためのURL文

¥100

今年のオープン戦投手成績をスクレイピングしていく!

2024年プロ野球開幕まであと少しですね。 オープン戦がおかなわれています。 本記事では、2024年のオープン戦の成績データを全球団スクレイピングする方法を紹介します。 ※スクレイピングする際はサイトに負荷をかけないこと、サイトの規程等に従い行いましょう。 今回スクレイピングするサイトはこちらです。 1. インポート使用するライブラリをインポートします。 import pandas as pdimport seaborn as snsimport time as ti

¥200

プロ野球の試合の観客数データを35行のコードで取得する2023年版

はじめに 2023年もあとプロ野球は日本シリーズを残すのみになりました。 今年は関西対決で大いに盛り上がっていることでしょう。 今回は各球団のプロ野球の試合の観客数を14年分(2009年〜2022年)取得します。 データ取得元データ取得元は、プロ野球Freakさんです。 いつもお世話になっています。! スクレイピングコード全体コードの全体は以下です。 scrape関数はその名の通りスクレイピングの処理をします。 urlにスクレイピングするサイトのURL、yearは年の

¥100〜
割引あり

40行で13年の全球団の動員数をスクレイピングする

プロ野球選手の成績をよくとっていますが、選手のデータだけがデータじゃない!(ぇ 今回は各球団の球場の来場者数をスクレイピングします。 ※スクレイピングを行うので過剰なアクセスは気をつけましょう 今回のプログラムは主に3つの部分に分かれます。 ライブラリインポートでは今回使うライブラリのインポートをします。 スクレイピング関数では、アクセスしたURLで取ってきたデータを加工する処理を関数にまとめています。 メイン処理では、各チーム、各年ごとURLが分かれているので、URLを文

¥200

30行でスタメンデータを集計してデータフレームにまとめる

前回スタメンデータをスクレイピングして各打順ごとの出場回数を集計してグラフにしました。 グラフにしてみることがメインでしたので、集計してそのまま可視化していましたが、選手が各打順で出場回数が何回か見たいこともあると思います。 また、なによりもデータとして持てる形にしておきたいことも多いです。 そこで、今回はプロ野球のスタメンデータを使って、各選手(1軍で出場機会があった選手)の打順ごとの出場回数をデータフレーム形式で持つようにします。 ライブラリをインポートimport p

¥100

プロ野球スタメンデータを15行でスクレイピングする

プロ野球のスタメンデータをスクレイピングします。 毎度お世話になっているプロ野球フリークさんにはスタメンデータがあり、各試合の1番〜9番までのスタメンが記録されています。 今回はこのデータをスクレイピングして、各球団のスタメンデータを15行で作成します。 ライブラリをインポートまずは今回使うライブラリをインポートします。 import pandas as pdimport matplotlib.pyplot as plt%matplotlib inline URL作成ス

¥150

25行で大谷さんの2021年シーズンの毎試合の成績をスクレイピングする

9月も終わり、メジャーリーグ、プロ野球も終盤です。 野球のデータとなると年単位などある程度データ数が必要で、データの取り方も年単位の成績データで持つことが多いです。 しかし、毎日の試合の成績をデータとして持ちたい、そこからデータを加工したいと言うこともあると思います。 今回は、今シーズン、9月8日時点でホームラン数トップを走って大活躍の大谷選手の2021年の毎試合の成績をスクレイピングします。 (コードはホームページからのデータから取りにかかるので、最新のデータが取ることがで

¥100

プロ野球先発投手データを14行のコードで取得する

野球は投手が8割といわれるほど重要なポジションです。(諸説ありますし、何が重要かは人それぞれです。) 先発投手のデータを取得して分析していこうと思います。 まずはデータを取得するところからになります。(えぇ・・・ だってデータがないと始まらないのですもの。 それでは 14行のコードで取得できます!14行でプロ野球12球団の今シーズンの先発データを取得できます。 import pandas as pdimport timeif __name__ == '__main__'

¥200

プロ野球選手のプロフィールデータをいっきに10年分取得してみた

前回プロ野球選手の成績データを10年分スクレイピングしました。 前回スクレイピングしたデータセットは主に成績データになります。 プロ野球選手のデータには推定年俸や身長、体重、出身、年齢といったプロフィールデータもあると何か特徴を捉える助けになるかもしれません。 そこで今回は、プロ野球選手のプロフィールデータを10年分、全チームスクレイピングします。 前回のプロ野球選手成績データの記事は以下になります。 こちらの記事では成績データを10年分をとるための方法が記載されていますの

¥200

プロ野球のデータが入りにくいので10年分のデータをスクレイピングした

更新日  :2020/08/02 更新内容 :プログラムの修正 最終更新日:2020/11/25 更新内容 :プログラムの修正 プロ野球のデータは手に入りにくいです。 公式のデータベースもなければ、NPBのサイトで掲載されている程度です。 そのため、データを取るにはスクレイピングが必要です。 この記事を書いていく中でデータを取るのにも、いちいちデータをスクレイピングしてセイバーメトリクス指標を計算してとなかなかの手間です。 もういっそのことデータを取ったほうがいいんじゃない

¥400

2020年のオープン戦も終わったので今年のオープン戦の野手、投手成績のデータを収集する

2020年のプロ野球の開幕も決まり、オープン戦も先週終わりました。 さっそく今年のオープン戦の成績を入手して分析をしようと思います。 前の記事にプロ野球の成績データのスクレイピングを作ってあるので関数を使いまわせば簡単に取れるでしょう! と、思ったのが甘かった・・・ 微妙にデータの項目や構造が違ったので全く使えない・・・ スクレイピングではよくあることです。 全く同じ構造をしているホームページのほうが少ないですからねw そこで今回は、プロ野球の公式サイトからオープン戦成

¥300

2軍(ファーム)選手を分析してダイヤの原石を探そうぜ<データ準備編>

プロ野球選手の分析をするとき1軍の選手や有名選手を分析することがほとんどと思います。 しかし、これから活躍しそうな選手、化けそうな選手を調べたくないでしょうか? そこで、2軍ファーム野手のバッター成績をクラスタリング分析して、クラスターごとの注目の選手を探っていきたいと思います。 ではさっそく分析をしていきたいところですが、データがないところからのスタートになります。 分析の流れは、データ準備、データ処理(クラスタリングの実装)、データ分析の3工程で行います。 3工程に合わせ

¥380