【スプラ3】 ブキの強さを数値化する方法を考えた

こんにちはー! Splatoon 統計課 @splatoon_stat です。
Splatoon 統計課ではスプラトゥーンの戦績データを用いていろいろなことを分析しています。 スプラトゥーンにおいてデータを活用して知りたいことはいくつもありますが、中でも「強いブキを知りたい」というのは多くの人が知りたいテーマのひとつではないでしょうか。 そこで今回はブキの強さを数値化する方法について考えてみたいと思います。



結論

「ブキ使用率」と「ブキ使用者の平均Xパワー」に基づいてブキの強さを表しているであろう数値を算出し偏差値として表現しました。 以下のヒートマップは 1/18 ~ 1/31 の v2.1.0 のデータを用いてブキ偏差値を算出した結果です。

以下これに至る過程を説明します。



データの収集方法

戦績データは例によって stat.ink に投稿されたバトルの統計情報をダウンロードして使用させていただきます。

記事内のグラフ等はすべて以下の条件にマッチする戦績を使用して作成します。

  • 期間: 2023/1/18 ~ 2023/1/31

  • 対象バトル: Xマッチ

  • ゲームバージョン: v2.1.0

条件にマッチしたバトル数は計18,046戦で、ルール内訳は以下の通りです。

  • エリア: 5,776

  • ヤグラ: 4,870

  • ホコ: 4,381

  • アサリ: 3,019

使用したデータは stat.ink の統計情報ダウンロードページからダウンロードできます。 stat.ink および関連ツール開発者に大感謝🙏
Directory Index of /splatoon-3/battle-results-csv

なおデータの偏りを抑制するため投稿者の使用ブキ等の情報は統計から除外しています。 また本記事では実力の近いプレイヤーがマッチングされるという仮定に基づいて、投稿者のバトル時のXパワーと参加プレイヤーのXパワーは等しいと仮定して話を進めています。

収集したデータの傾向 (2/4 追記)

使用するデータにおける stat.ink 投稿者のXパワーの分布(全ルールごちゃ混ぜ・ユーザーの重複あり)は以下の通りです。

各統計量は以下のようになっています。

  • 平均値: 2,055

  • 標準偏差: 302

  • 25%: 1,840

  • 50%: 2,050

  • 75%: 2,290

※ あくまで stat.ink 投稿者のXパワー分布であり、Xマッチプレイヤー全体の分布とは大きく異る可能性がある点にはご注意ください。



強さと相関する指標を探す

まずブキの強さと相関がありそうな指標をいくつか見てみてどのような性質があるか確認してみます。

  • ブキ使用率

  • ブキ使用者のXパワー

  • ブキ勝率


指標1: ブキ使用率

ブキの使用率はこれまでも何度も出していますが、stat.ink 投稿者以外の7名のプレイヤーのブキの使用率を集計したものです。

以下はエリアのブキ使用率です。

勝ちやすい強いブキを持ちたいと考えるプレイヤーは一定数いると考えられるため、基本的には強いブキは使用率が高くなる傾向があると思います。 ただし注意点もあります。 上位にシューターが多いことからもわかるように、扱いやすいブキも使用率が高くなる傾向があるようです。 つまりこの指標をブキの強さと捉えると扱いやすいブキを過大評価してしまう懸念があります。

また統計的観点からは1週間分(各ルール1,500戦)程度の少ないデータからでも割といい精度で求められる都合のいい指標です。


指標2: ブキ使用者の平均Xパワー

以前Xパワーごとのブキ使用率を確認しましたが、強いブキは上位層で使用率が増えそうだということがわかりました。 これは上位層は強いブキを好むという側面と、強いブキを使えば上位層に行きやすいという側面があります。

ただこの調べ方だと、そもそもどこからが上位層なのかの決めが必要なのと必要なデータ数が増えてしまう問題があります。

そこで今回はブキを使っているプレイヤーのXパワーの平均値を取ることで、どのくらい上位層に使われているのかの指標とすることを考えます。 このとき投稿者以外のプレイヤーのXパワーはデータから得られないため、投稿者のバトル時のXパワーをそのバトルに参加したプレイヤーのXパワーとして算出します。

以下はエリアにおいてブキ使用者の平均Xパワーを算出したものです。

論理的には強いブキはXパワーを上げやすいはずなので、強いブキを使用するプレイヤーのXパワーは高くなる傾向があると考えられます。 具体的なブキでいうとシャープマーカーやスクリュースロッシャーなどがその傾向が強そうです。 一方で上位のブキを見るとH3リールガンやボトルガイザーなどがあり、操作性に癖があり使いこなすのに練度が要求されるような扱いづらいブキも平均Xパワーが高くなる傾向があるようです。 つまりこの指標をブキの強さと捉えると扱いづらいブキを過大評価してしまう懸念があります。

また統計的観点からは、ある程度使われているブキに関しては1週間分(各ルール1,500戦)のデータでも十分傾向をみれるだけの精度はありますが、あまり使われないブキでは精度が悪くなってしまいます。

投稿者のパワーで他7名のパワーを近似することの妥当性 (2023/2/22 追記)

投稿者のパワーで他7名のパワーを近似することの妥当性については以下の一連のツイートで論点の整理をしていますので、気になる方がいれば覗いてみてください。

〜追記ここまで〜


指標3: ブキ勝率

ブキ勝率は一見ブキの強さと相関がありそうですが結論から言うとブキの勝率はブキの強さをほとんど表さないと考えられます。

以下はエリアにおいてブキ勝率を算出したものです。

多くのブキが50%前後の値を取っていて誤差以上のブキごとの違いがそもそもほとんどありません。 Xマッチでは原則近いXパワーのプレイヤーとマッチングすると考えられるため、レーティングが適正値に収束するほど勝率は50%に収束する傾向があります。

以下はブキごとのバトル数と勝率の関係を示します。 バトル数が多いブキほど勝率50%との差が小さくなる様子がわかります。 よってブキ勝率を比較しても意味のある情報はさほど得られません。

またブキごとの試合条件の違い(主にXパワー)が勝率に大きく影響します。 スプラトゥーンでは持ちブキをプレイヤーが選択できるため、例えば下位層で勝率が高いが上位層ではそもそも使われないブキがあったとすれば統計上勝率は高いという結果になります。 プロモデラーRGなんかは割とこういった傾向が見られます。

プロモデラーRGを持つプレイヤーのXパワーは比較的下位層に偏っていて、ボリュームゾーンのXパワー1,800~1,900くらいでの勝率は高いです。 上位層ではあまり使われない傾向がありますが、下位層で勝っていることが結果的にプロモデラーRGの勝率を押し上げるため勝率で上位に位置しています。

このようにブキごとの試合条件の違いを考慮しない場合、ブキの強さを表しているとは言えないであろう勝率の上振れや下振れが発生することがあります。 またXパワーごとに細かく分析すればより意味のある情報が得られる可能性もないとは言い切れませんが、そうすると今度は必要なデータ数が増えてしまいデータを集め終わる頃には環境が変わってしまいます。


指標まとめ

各指標の性質をまとめると以下のようになります。



ブキの強さ成分を抽出するには?

というわけで直接的にブキの強さを表す指標はありませんでした。 が、ブキ使用率とブキ使用者の平均Xパワーは共に「強さ」と「扱いやすさ」について関連があるようです。

図にしてみるとこんな感じです。
ブキには「強さ」の軸と「扱いやすさ」の軸があります。 ただしこれらは直接観測できません。

ブキ使用率とブキ使用者の平均Xパワーは「強さ」と「扱いやすさ」に関連した指標であり、観測できます。 また「強さ」については共に正の相関がありそうですが、「扱いやすさ」については片方が正の相関、もう片方が負の相関を持っていそうです。

ということはこのふたつの指標を組み合わせてひとつの指標に落とし込めれば「扱いやすさ」成分を相殺させて「強さ」成分のみを抽出できそうです。



いざふたつの指標をひとつに!

あとは指標を合成する方法を考えます。
エリアにおける2変数の散布図は以下のようになります。

スケールも分布もバラバラなので揃えてあげます。
使用率は Box-Cox 変換で正規分布に近づけたあと標準化します。 平均Xパワーは元々正規分布っぽいので単に標準化します。 標準化というのは平均0分散1にスケーリングする操作ですね。 これで2変数を同等に扱えるようになりました。

次に強さの軸の方向を決めて直交射影します。 イメージとしては以下のような感じで強さの軸に対して垂線を下ろして強さの値を求めます。

強さの軸の方向は単純に横軸とのなす角 $${\theta}$$ を用いて表します。

問題は $${\theta}$$ の決め方ですが、意味合いをわかりやすくするために平均Xパワーをどの程度重視するかを示すパラメータ $${k \left( 0 \le k \le 1 \right)}$$ を導入して $${\theta = \frac{\pi}{2}k}$$ と表してみます。 $${k=0.5}$$ のとき使用率と平均Xパワーを平等に重視することを意味します。
正直ここは感覚的に決めるしかないのですが今回は少しだけ使用率を重視して $${k=0.45}$$ としてみます。 図示すると以下のような感じです。

最後に得られた値をもう一度標準化した上で偏差値に変換すると以下のようにブキごとの偏差値が得られます。

これを各ルールごとに算出したのが冒頭のブキ偏差値のヒートマップです。

使用率や平均Xパワーなどの指標を単独で見るよりかは、ブキの扱いやすさに依らない強さの目安として妥当な並びが得られているような気もしなくないです。 ブキ選びの参考くらいにはなるかもしれません。



まとめ

今回はブキの強さを数値化する方法について考えてみました。
やや強引ではありますが「ブキ使用率」と「ブキ使用者の平均Xパワー」に基づいてブキの強さを表しているであろう数値を算出することができました。 是非ブキ選びの参考にしてみてください!

それでは、最後まで読んでいただきありがとうございました。


この記事が気に入ったらサポートをしてみませんか?