見出し画像

ミュウツーHR争奪戦をデータサイエンスする

はじめに

この夏、全国で開催されている「ミュウツーHR争奪戦」
普段の店舗大会とは異なり、シールド戦と呼ばれる以下の特殊なレギュレーションで対戦が行われます。

✓ 通常よりコンパクトな「40枚デッキ」「サイド4枚」で対戦を行う
✓ デッキに入れられるカードは、強化拡張パック『リミックスバウト』×15パックで当てたカード(+参加賞)のみ
✓ 当てたカードの範囲内であれば、対戦ごとにデッキの中身を入れ替えてもOK

カード資産ゼロからでもワンチャン優勝可能で、世界300枚限定プロモカード「ミュウツーHR」が手に入る激アツ大会。
その反面、金を積んで軽率に優勝レシピをコピーすることができず、練習を積んでデッキ構築スキルを磨く必要があるため、“金はあるが時間はない”社会人にとっては向かい風ともいえます。

練習時間を割かずに優勝レシピを導く方法はないんか……。

……。

…………。

せや、データサイエンスしたろ!

データサイエンスとは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。(Wikipedia より)

平均値

今回扱うデータとして、各大会運営店舗の Twitter に上げられている優勝レシピ 100件弱を収集しました。
まずはシンプルに、各カードの平均採用枚数を見ていきます。

下図において、濃い青は全体における平均採用枚数、淡い青は当該カードを1枚以上採用したデッキにおける平均採用枚数を表しています。
個別の採用率はここでは記載しませんが、採用率が100%である「アンズ」「ローラースケーター」では濃い青と淡い青の値が一致します。
(完全に重なって淡い青が見えない状態になっています。)

画像1

クラスタリング

次に、デッキタイプの傾向を分析してみましょう。
それぞれのデッキレシピを、各カードの採用枚数を並べた72次元ベクトルとみなし、クラスタリングの一手法である k-means 法により、いくつかのクラスタ(集団)に分類します。

結果は、下図のとおりです。
人間が見やすいように、t-SNE と呼ばれる次元削減手法により二次元にマッピングしています。

画像2

赤:炎(+草 and/or 超 and/or 悪)
ピンク:炎+草(+超 and/or 悪)
黄色:草(+超 and/or 悪)
青:水(+草 and/or 超 and/or 悪)
緑:水+闘
水色:炎+水

全体的な傾向としては、「リザードン&テールナーGX」に代表される炎デッキが最も多く、次いで「カメックス&ポッチャマGX」を主軸とした水デッキが続きます
残る GX ポケモンである「フシギバナ&ツタージャGX」「アローラペルシアンGX」の2種類は色拘束が緩いためか、様々なデッキに出張している様子が見受けられます。

続いて、各クラスタに属する代表的なデッキタイプを見てみましょう。
(下記、いずれも筆者の主観による分析です。クラスタリングの結果をどのように意味づけるかは、勘と経験によるところがあります。)

赤:炎(+超 and/or 悪)

「リザードン&テールナーGX」を軸にした炎デッキの中でも「基本炎エネルギー」の採用枚数が特に多く、概ね10枚以上を採用するクラスタ。
〈ぐれんのひばしらGX〉により、一匹でエネルギー加速とアタッカーを兼ねる「リザードン&テールナーGX」の単体性能の高さが際立ちます。

ピンク:炎+草(+超 and/or 悪)

色拘束の緩い「フシギバナ&ツタージャGX」「アローラペルシアンGX」「ズガドーン」などを、炎タイプと組み合わせたクラスタ。
「溶接工」は、炎タイプでないポケモンたちの始動ターンも短縮することができるので、「リザードン&テールナーGX」が当たらなくとも採用価値があるといえるでしょう。

黄色:草(+超 and/or 悪)

ピンククラスタから炎タイプを抜き、主軸を「フシギバナ&ツタージャGX」に切り替えたクラスタ。
非GXながらHPが高く、省エネで動ける「モジャンボ」の採用も目立ちます。

青:水(+草 and/or 超 and/or 悪)

「カメックス&ポッチャマGX」率いる水デッキのクラスタで、採用される「基本水エネルギー」の枚数が10枚を超えることも。
水タイプの「ホエルオー」「カイオーガ」を不採用としたデッキレシピも多く、これらのポケモンの採用をリスクと捉えるプレイヤーが一定数いるようです。

緑:水+闘

3エネ160点を叩き出す非GXポケモン「ケケンカニ」のポテンシャルを発揮できる、水+闘タイプを組み合わせたクラスタ。
非GXながら単体性能の高い「グラードン」を採用しやすく、「カメックス&ポッチャマGX」が苦手とする「アローラペルシアンGX」を相手しやすいというシナジー効果もありそうですね。

水色:炎+水

「リザードン&テールナーGX」と「カメックス&ポッチャマGX」を抱き合わせた欲張りクラスタ。

相関係数

最後に、各カードの関係を相関係数により可視化してみます。
相関係数は、ある2データ間の相関(関連度合い)を -1〜+1 の値で表す指標で、
今回の分析においては、あるカードAが採用されているとき、カードAと別のカードBとの相関係数が

+1 に近い:カードBも一緒に採用されやすい
-1 に近い:カードBは一緒に採用されにくい
0 に近い:カードBが採用されるか否かにカードAは関係しない

といえます。

「ミュウツーHR争奪戦」のカードプール全72種の組合せにおける相関係数を計算し、以下の表にまとめました。
表中において、相関係数が +1 に近い(正の相関がある)ほど赤く、-1 に近い(負の相関がある)ほど青く色づけしています。
また、カードの採用例がなく、相関係数を計算できなかった箇所は「-」と表示しています。

画像3

ここから、以下のようなことが読み解けそうです。

✓ 「フィオネ」「ロトム」は、デッキタイプに関わらず採用する
✓ 「ポニータ」は、「ギャロップ」抜きでも採用する
✓ 「カメックス&ポッチャマGX」は、単色気味な水デッキで使う
✓  闘タイプは、水タイプと組み合わせて使う
✓「エリカ」は、「ローラースケーター」が多ければ採用しない

「フィオネ」「ロトム」は、デッキタイプに関わらず採用する

これらのカードは、ほとんどのカードに対して相関係数が概ね 0 程度で、デッキタイプを問わず採用されていることがわかります(※)。
「ロトム」は「基本超エネルギー」と正の相関が見られることから、〈エネアシスト〉によるエネルギー加速を狙うことも視野に入れてデッキ構築をするとよさそうです。

※ 採用例が著しく少ない場合も相関係数が 0 になりやすいため注意してください。

「ポニータ」は、「ギャロップ」抜きでも採用する

多くの進化ポケモン(「モジャンボ」「アローラペルシアンGX」「キテルグマ」など)が、そのたねポケモンと非常に強い正の相関(0.95 前後)を示す中、「ギャロップ」は 0.80 に留まっており、「ポニータ」単体での採用例が一定数見られることを示唆しています。
実際、無色1個で好きな基本エネルギー2枚を手札に持ってこれる〈ちいさなおつかい〉の汎用性が高く、多くのデッキに採用できそうです。

「カメックス&ポッチャマGX」は、単色気味な水デッキで使う

「フシギバナ&ツタージャGX」と「基本草エネルギー」との相関係数が 0.88、
「リザードン&テールナーGX」と「基本炎エネルギー」との相関係数が 0.83 に対し、
「カメックス&ポッチャマGX」と「基本水エネルギー」との相関係数は 0.97 と極めて高い数値です。
言い換えれば、前者の2種類は多色構成(3色程度)になる傾向があり、後者は単色気味(1-2色)になる傾向があるといえます。

「カメックス&ポッチャマGX」は、手札に「基本水エネルギー」さえあれば回復し続けられるため、後続を育てず一匹を倒させない動きをとることができます。
一方、前者の2種類はどこかで体力がつきてしまうため、(タイプを問わず)強力なポケモンをデッキに入れておき、ベンチで後続を育てておく立ち回りが必要なのかもしれません。

闘タイプは、水タイプと組み合わせて使う

シールド戦の40枚デッキに入るエネルギーの合計枚数は、デッキタイプにより数の大小はあるものの概ね15-19枚程度です。
エネルギーの合計枚数が一定であるならば、基本エネルギー同士の相関係数は、その定義上、負の数になりやすいことがわかります。

しかしながら、「基本闘エネルギー」と「基本水エネルギー」の間には 0.28 の弱い正の相関があり、闘タイプは水タイプと一緒に使われやすい、あるいは、闘タイプは水タイプと一緒でないと使われないことを示唆しています。
この組合せは、非GXポケモン離れた高打点を持つ「ケケンカニ」の真価を発揮できるデッキタイプ(前節の緑クラスタ)そのものであり、人間の直感とも一致します。

「エリカ」は、「ローラースケーター」が多ければ採用しない

デッキを回すために大事なトレーナーズ、とりわけドローサポートと呼ばれる類いのカードは、シールド戦において数が不足しがちで、デッキタイプに関わらず“当たったら入れ得”な部分があります。
「ミュウツーHR争奪戦」の参加賞である「エリカ」についても同様の傾向がみられますが、「エリカ」と「ローラースケーター」の間に -0.27 の弱い負の相関が見られることから、必要十分なサポートが揃っている場合にはその限りではないといえるでしょう。

上記のような負の相関関係は、「ローラースケーター」と「ドローエネルギー」との間にも確認できますね。

おわりに

いかがでしたか?

大袈裟な前振りをしたわりに、人によっては目新しい知見を得られなかったかもしれませんが、そこは筆者の技量不足によるものとお考えください。
個人的な見解ですが、データサイエンスと呼ばれる領域は、データから実際の事象や因果関係を読み解く際に必要な“勘と経験“を平準化する(誰でもデータを読み解けるスタートラインに立つ)ためのテクニックだと考えています。
ですので、ふだん数字を見るのが苦手な人も、この記事で取り上げた図表を眺めて、新しい発見をすることにトライしてみてはいかがでしょうか。

……という徳の高そうな雰囲気で記事をまとめることで、「ミュウツーHR争奪戦」の本番に「リザードン&テールナーGX」「リザードン&テールナーGX」「溶接工」みたいな当て方にならないかな、と目論んでいる筆者でした。

最後までお読みいただき、ありがとうございました!

この記事が気に入ったらサポートをしてみませんか?