見出し画像

回線速いとCF勝てるのか?をデータ分析で確かめる #1:調査設計

この記事はEAが提供するサッカーゲーム、「EA Sports FC(以下EAFC)」シリーズに関連したものです。まずは回線の速さ(を含めた品質全般)が勝利にどの程度関係があるかをデータ分析で調査していく連載をスタートします。ゲーマー向けだけでなく、統計的な手法のお勉強にもなるように記事を書いていきたいと思います。よろしくお願いします。


調査を思い立ったきっかけ

EAFCにまつわる回線の話

このゲームはインターネット回線を通じたオンライン対戦が可能なゲームであり、そうなるとやはり回線品質の善し悪しが勝負に影響があるかは誰しもが気になるところです。EAFCのゲームサーバは国内では東京に1カ所しかないので、どうしてもそのゲームサーバとの物理的な距離による違い(ゲーム内ではPing値という形で表現される)が生まれます。そして、普通に考えれば遠い方が不利なのではと思うことは仕方のないことです。
EAはこの点について工夫しており、サーバーとの物理的な距離によらず公平にゲームが成立するようにオンライン対戦の仕様を定めて実装しています。これについては以下のURLを見て頂ければと思います。

https://help.ea.com/jp/help/ea-sports-fc/game-data-centers-fc/

ただし、この話は「東京に住んでいるPing値4msecのAさんと、地方に住んでいるPing値20msecのBさんが対戦しても公平に処理されていますよ」ということであり、そのゲーム、その1試合に関するものです。

このゲームのメインモードであるUT(Ultimate Team)においては、毎週約30試合ほどプレイする機会があり、AさんとBさんが仮に同じ腕前だとすると、30試合中何試合勝てるかという部分まで公平かどうかは誰にも分からない状態になっています。

まぁでも直接のきっかけはコレ

高ランクが関東に集中しているというのが事実かどうかも含め回答できないのが悔しかったのよねぇ。

調査設計をする

調査設計って何さ?って話なのですが、本職がコンサルティング業ということもあり、ちょっと職業病が出ちゃってます。ただ、趣味のゲームの範囲なので、レベルはそれなりです。
今回、お題を以下のように定義して、統計的な手法を用いて検証していきたいと思います。あ、統計的な手法のレベルもそれなりです・・・。

お題:回線速いとCF勝てるのか? をかみ砕く

CF:Champions Final、毎週開催されるイベントでUTモードにおける個人成績のバロメーターであり、最高は20勝。CFに出場するためには10試合のプレーオフを勝ち進む必要がある。

統計的な手法を用いるので、簡単に言えば数字を数字で説明するということになります。なので、このお題については以下のようにかみ砕く必要があります。

CFの勝利数とサーバとの接続品質(Ping値)には因果関係があるか?

統計において因果を証明するというのは大変難しい話なのですが、今回はあくまで調査したデータの範囲において、因果関係と思われる説明が出来るかということにしたいと思います。

元となるデータの仕様

今回の調査において、当然ですが元となるデータが必要です。このデータはEAから提供されるわけもなく、自分で用意する必要があります。今回はアンケート調査によるデータ生成を試みたいと思います。ここで重要なのは、CFの勝利数に繋がりそうな色んな数字を取る必要があるということです。ざっと考えても以下のようなものがあります。こちらの細かい項目は別の記事で考察したいと思います。

  • CFの平均勝利数

  • CF出場率

  • 毎週の平均試合数

  • 課金額

  • 回線品質(Ping、パケロス、ジッターの値、EAのサイトから入手)

  • コーチング等を受けた経験の有無

  • 他のモードを遊んでいるかどうか

  • 他のゲームを遊んでいるかどうか

  • 使用しているフォーメーションや戦術

  • 現在のスカッドの総額 などなど

採用する統計的手法

データがそろった後は一通りヒストグラムや単純集計をしたいと思います。特に、BIツールなどで日本地図にランク帯を載せた絵みたいなものは作ってみたいですね。本当に関東に高ランクが集中しているか分かるはずです。

その後は、「多変量解析法」というのを用いてCFの平均勝利数を他の数字で説明するというのをやってみたいと思います。これ、イメージ沸きにくいかと思いますが、家賃に喩えるとこんな感じになります。

家賃=駅からの近さ+部屋の広さ+築年数+階数+・・・

なんじゃこりゃ!?って感じですが、それぞれの変数(この例では駅からの近さなど)に実は係数(重み付け)がついていて、それぞれの係数×変数の結果を全部足すと家賃の数字が推定できる、という感じです。これによって築年数を上げ下げしたりすると家賃がどのくらい変わるのかというシミュレーションも出来たりします。

この数式を導き出すことができれば、Ping値などの回線品質の値が勝利数にどのくらい影響するかを推定することができます。もし、相関も因果も何にもない場合は、数式にこれらの値が変数として登場しません。どういう結果になるか今から楽しみです。

おわりに

今回の試みは基本的に私の趣味の領域ですが、このゲームを遊んでいる人だけじゃなく、データ分析にちょっと興味のある層にも届けたいと思ってます。あと、最終的には動画にもしようと思いますので、長い文章を読みたくない人は動画化をお待ちください笑

また、少しでも応援していただけると励みになります。よろしくお願いします。


この記事が気に入ったらサポートをしてみませんか?