見出し画像

AIに2024年の沢村賞を予想してもらった(前半戦終了時点)

こんにちは、ヤキグラです。
皆さんは今年の沢村賞は誰が受賞すると思いますか?
少し気が早い話題ではありますが、今回のnoteでは沢村賞を誰がとるか人工知能(AI)の分野の一つである「ロジスティック回帰」という手法を用いて予想してみたいと思います。

ロジスティック回帰とは

ロジスティック回帰は、回帰分析と呼ばれる分析手法の一種となります。
回帰分析とは、結果となる数値と要因となる数値の関係を調べて、それぞれの関係を明らかにする手法であり、結果となる数値を目的変数、要因となる数値を説明変数と呼びます。
ロジスティック回帰では、目的変数をある事象が起こるか起こらないかの2パターンとすることで、その事象が起きる確率を算出できる数式を導き出します。
例として「不動産屋が、自身が持つ賃貸物件が売れる確率を知りたい」というケースを考えてみましょう。
説明変数をその物件の家賃や広さ、築年数などとし、目的変数をその物件が売れたかどうかとして、過去の物件データをロジスティック回帰で分析します。
そうして導き出された数式に、現在自身が持っている物件のデータを当てはめることで、その物件が売れる確率が分かります。
確率が分かるだけでなく、家賃や広さといったそれぞれの項目が、売れる確率にどれだけの影響を与えているかも知ることができます。

沢村賞予想方法

説明が長くなってしまいましたが、ここからはそんなロジスティック回帰を使って沢村賞の予想を行っていきます。
まず、説明変数と目的変数を以下のように設定します。

説明変数
・沢村賞選考基準7項目
(防御率・登板・完投・勝利・勝率・投球回・奪三振)
・上記7項目で基準を達成している項目数
(防御率2.50以下・25登板以上、10完投以上、15勝以上、勝率.600以上、200投球回以上、150奪三振以上)
・過去の沢村賞受賞回数

目的変数
・沢村賞を受賞したがどうか(受賞した→1、受賞していない→0を設定)

このようなデータを2005~2023年で規定投球回到達かつ沢村賞基準を3項目以上達成した投手、延べ128名分学習させます。
例えば、2022~2023年分の学習データは以下のようになります。

2022~2023年分 学習データ

この学習データから「算出される値が1に近いほど、沢村賞受賞の可能性が高い」という数式が導き出されます。(便宜上、その値を沢村賞ポイントと名付けます。)
こうしてロジスティック回帰によって導き出された、沢村賞ポイントを算出する数式は以下のようになりました。

沢村賞ポイント = 1/(1+exp(-A))
A =-1.44×[防御率] +0.32×[勝利] +0.85×[基準達成項目数]-0.22×[受賞回数]-7.31

なんだかややこしい数式となっていますが、簡単に言えば防御率が低く、勝利数が多く、沢村賞基準達成項目数が多く、過去の受賞回数が少ないほど沢村賞を受賞しやすくなるということです。
この数式を見て「説明変数9項目あったのに、数式には4項目しかない…?」と疑問に思った方もいるかも知れません。
AIに数式を作ってもらった結果、登板・完投・勝率・投球回・奪三振の大小は沢村賞の選考に影響しないと判断されたのです。
(実際には達成項目数の中で、沢村賞基準を超えたかどうかは見ているため全く影響していないわけではありません。)

ということで、AIに数式を作ってもらうことはできましたが、この数式がどれほどの信頼できるものなのかまだ分かりません。
信頼度を検証するために、実際の沢村賞受賞者と各年度の沢村賞ポイント1位を比べてみましょう。

年度別 沢村賞受賞者と沢村賞ポイント1位

該当者なしだった2019年と短縮シーズンであった2020年を除いた年で、沢村賞受賞者と沢村賞ポイント1位が一致する結果となりました。
2019年の有原についても、沢村賞受賞者中最低である2016年ジョンソンのポイントを下回っていますので、該当者なしという結果も妥当と思われます。
2020年については当時の選考委員会の講評を見てみると、大野が菅野を上回った項目が多かったことが選考理由となっていたようです。
そのような相対評価での評価方法を反映出来ていないのは、現在の数式の欠点となっています。
それでも19年間で17年(2019も含めれば18年)の一致というのは、なかなかの信頼度と言っていいのではないでしょうか。
(それにしても、0.9越えを2度記録してる田中将大はエグいですね…)

2024年前半戦 沢村賞ポイントランキング

沢村賞予想方法が確立できたので、実際に2024年の前半戦終了時点で沢村賞に一番近いのは誰か見てみましょう。
沢村賞ポイントの算出には、前半戦の成績を143試合換算したものを使用しています。
沢村賞ポイントランキングは以下のようになりました。

AIによる沢村賞予想ランキング(2024年 前半戦終了時点)

見事1位となったのは才木浩人(阪神)です。
防御率と勝利数はリーグ2位、奪三振はリーグ1位タイという抜群の成績で、基準4項目をクリアしポイントを稼ぎました。
才木と僅差の2位には床田寛樹(広島)がランクインしました。
こちらも基準4項目をクリア、3位以下に差をつけての2強となっています。
パリーグでは最高位となる3位には、リーグ2位の防御率とリーグトップの勝利数でポイントを稼いだ有原航平(ソフトバンク)がランクインしました。
4位には基準クリアは2項目ながら圧倒的な防御率を残している髙橋宏斗(中日)が規定未到達では唯一のランクイン5位にはパリーグ防御率トップのモイネロ(ソフトバンク)がランクインしています。

まとめ

ということで、前半戦終了時点で最も沢村賞に近いのは才木投手ということになりました。
ただ、これはあくまで今のペースのままシーズンを終えればという話です。
後半戦の投球次第でほかの投手の逆転の可能性もあります。
シーズン終了時に改めて最終予想のnoteを投稿予定ですので、そちらもぜひお楽しみに。

最後までご覧いただきありがとうございました。
よろしければnoteの”スキ"・フォローをしてもらえますと、とても嬉しいです。

この記事が気に入ったらサポートをしてみませんか?