NPB短歌スタメンをつくる
この投稿は「スポーツアナリティクスAdvent Calendar 2022」19日目の投稿です。
けんざぶです。
4回目の投稿です。W杯決勝を見ながら書いていますが、野球ネタです。
(ヘッダー画像:筆者撮影。'22/9)
着想
たまに話題になる、短歌・五七五七七に読めるスタメンを自動生成させます。そもそもですが、2022年のNPBレギュラーシーズンでは短歌スタメンは0件だったようです(後述の手法による)。
今回は、2022年NPBレギュラーシーズンでスタメンになった選手から短歌スタメンになり得る組み合わせを探していきます。
前提
モーラ - Wikipedia を参考に選手名の拍をカウントします。
選手名の読み方については、以下のルールを設けます。
1人の選手に対して読み方は1つとする
スコアボード・記事等で苗字のみで表記される選手:姓の読み
苗字+名1字を含む、上記以外の登録名の選手:姓名の読み
(このルールによって、上記ツイートとは吉田正・T-岡田両選手などの読み方がずれる)
実装
以下の手順で12球団でスタメンが組めるか探索していきます。
2022年NPBレギュラーシーズン全試合のスタメン、選手名と読み方を取得・定義
今回は指名打者制の試合における投手を考慮せず、1~9番のみとする
9個のスポットに対して、五七五七七を割り当てる
第一句から第五句をそれぞれ、1つだけ1名、ほか4つを2名で構成する
1つの句を2名で分ける場合、5拍の句は[[2拍, 3拍], [3拍, 2拍]]、7拍の句は[[2,5], [3,4], [4,3], [5,2], [4,4]]に分ける(1)。字余りの考慮はなんとなく4+4のみにしておく
チームごとに、今季のスタメンでの打順と守備位置の組み合わせを取得
選手を含むスタメンパターンとは異なり、セの各チームで50強、パで100強(2)
(1),(2)を組み合わせたラインナップに当てはまる選手がいるか探索
このとき、選手はその打順・守備位置でスタメン出場していることを条件とする
結果
以下4球団で計50パターン近く生成できました。
個人的に面白かったものをピックアップしてみます。
オリックス
上記ツイートでも挙げられていたようにオリックスは組みやすい名前が揃っているのかもしれません。T-岡田が第三句に収まる感じがとてもよい。
西武
西武は7拍の選手が少なく(そもそも苗字被りが少ない)、高橋光成が重宝されてました。①と②のメンバーの違いも面白いところ。
楽天
4拍の選手名が多く、逆に字余りすぎが面白くてピックアップしてみました。
日本ハム
新庄監督のおかげで多様なスタメンパターンがあり、今回の探索でもかなり多くのパターンを探すことができました。②の8(投)上原が面白い。オープン戦でガラポンの代わりに短歌スタメン採用しないかなあ。
感想
今回はNPB選手で短歌スタメンが組めるチームがあるか探索してみました。結果として(探索回数が少ないので他にも組めたかもしれないですが)パの4球団で生成できました。L,Fで投手入りもあったのでセ球団で生成されなかった理由を探ってみるのもアリですね。
アドベントカレンダー的視点で言うと、もうちょっと普段からいろいろネタを書き留めておこうと思いました。こういうライトなネタも真面目にやると楽しいですけどね。というわけで、12/19時点でもまだ枠が空いていますので、ライトなネタをお持ちの皆さんも投稿お待ちしてます!(再掲)