客観的データに基づくbeatmania IIDXの☆12難易度表を考えてみたい話

先日公開したこちらの記事、思ったより大きな反響があり驚いています。中でも、「この記事の方法を応用して客観的な☆12難易度表を作れないか」というご意見を多く頂きました。

そこで前回同様、木野(Twitter:@capue)さんのご協力のもと、新たにIIDX 26 Rootageのデータを分析して、プレイヤー間の☆12クリアランプの勝敗に基づく、譜面ごとの難易度推定を行ってみることにしました。

☆12難易度表の現状

こちらの記事に大変良くまとまっていますが、☆12難易度表の原型は15年以上前の十段スレ(当時は十段が最高段位です)にあったそうです。
 その後は段位スレから難易度表議論スレが独立し、現在のTwitterアンケートによる投票方式へと変遷しています。また、EXHARDについても同様のアンケート方式で表が作られています。

どちらの表も投票によって難易度を決める形になっているため、時には決定に対して賛否両論が巻き起こるようです。最近だと、ハード難易度表のS+(最高ランク)から3譜面がSへと降格され、数多くのプレイヤーを巻き込んだ議論へと発展しました。

匿名の投票方式全般に言えることですが、個々のプレイヤーの主観に強く影響されることや、投票するプレイヤーの適性(投票内容を判断するのに適正な実力かどうか。実力が高すぎてもかえって低難度帯の判断はできないことがあります)が不明であることなど、多くのプレイヤーが目標設定のために参考とするには、複数の検証すべきポイントがあります。

ということで、客観的データに基づいた☆12難易度表を、前回の記事に引き続く形で提案していきたいと思います。

イロレーティングとロジスティック回帰

前述のデータをもとに、IIDX 26時点で八段~皆伝を取得していた全プレイヤー同士の☆12クリアランプ勝敗数を算出し、そこからイロレーティング式(平均1500、係数400)のレートを求めました。段位ごとの分布がこちらです。

画像1

赤い直線は段位ごとのレート中央値を表しています。(データに八段・九段プレイヤーが加わったことで、十段~皆伝については前回の記事から大きくレートの変動があります。)

このようにして求めたレートを、プレイヤーごとに各譜面のクリア状況と対応させ、ロジスティック回帰分析を行うことで、各クリアランプについての「ランプ取得確率とレートの対応」を予測する回帰式を得ることができました。ここまでは前回の記事と同様の手順です。

回帰分析結果の解釈

こうして各クリアランプの難易度を推定することができました。推定されたハード難易度トップ10がこちらです。

画像2

前回からΧ-DENが新たに加わりました。難しいですよね。(推定ハード確率が27%や73%と半端な数字になっているのは簡単のためです。詳しくはロジスティック回帰についてお調べください。ヒントはネイピア数)

この表は50%の列で降順に並んでいますが、27%の灼熱2とMareや、73%の冥と灼熱など、所々ランキングが逆転しているところが見受けられます。このような現象はなにを意味しているのでしょうか。

説明のために、こんなグラフを作りました。横軸にレート、縦軸にレートから予測されるハード確率をとり、青色で「子供の落書き帳」、赤色で「DUE TOMORROW」の回帰曲線を描いてあります。

画像3

横軸のレートが1600を超えるあたりまでは、DUEの方が上=ハード確率が高くなっていますが、途中から逆転していることがわかります。
 つまり、落書き帳と比較して、DUEは低レートでもハードできる可能性があるが、高レートでもハードできない可能性があるといえます。よくある言い方をすれば、落書き帳と比べてDUEは個人差譜面であると言うことができそうです。

まとめると、27%確率で推定難易度を決めた場合、50%確率のそれと比べて、個人差譜面がより低難度に推定されることがわかりました。

既存の難易度表との比較

前項のように、ランプ取得確率を変えることによって、微妙に推定難易度が上下するのであれば、難易度表作成にあたって適切なランプ取得確率を定める必要がありそうです。

そこで、各確率ごとの推定難易度と、前述の3難易度表(ノマゲ、ハード、エクハ)を比較してみることにしました。
 それぞれの相関係数を求めたものがこちらです。

画像4

このように、一貫して27%レートがより高い相関を持っていることがわかりました。ということは、難易度表の投票にあたって、プレイヤーは五分五分より少し挑戦レベルの水準で票を入れがちだと言えそうです。

☆12難易度表の作成

推定した難易度を、よりわかりやすく表現するために、今回は「AA=12.0、Mare Nectaris=13.0として、各ランプごとに難易度を付ける」方式を試してみました。レーティングの線形性が保たれているので、(クリアランプ勝敗の観点で言えば)11.9と12.0の違いは12.9と13.0の違いと同じ、と大雑把に言うことができます。

 こうして出来上がった難易度表がこちらです。
 (ノマゲについては単独の難易度を求めることが非常に困難な譜面があるため、ノマゲ以上のランプを取得する難易度を推定しています。また、表同士の難易度に互換性はありません。)

画像6

画像6

画像7

いかがでしょうか。難易度の表現方式については、より良い案があればぜひぜひご提案いただきたいです。

比較のために、試しに既存のハード難易度表から大きく変動している譜面をピックアップしてみようと思います。
 既存表の難易度ごとに推定難易度の平均・標準偏差(σ)を求め、平均から大きく(2σ)離れている譜面を表にまとめました。

画像8

推定が正しければ、赤くハイライトされている譜面は、既存の表と比べて推定難易度が高い=既存の表を見て「詐称」と感じるはずです。緑は「逆詐称」気味ということになります。
 なんとなくCNとソフランは詐称気味、皿は逆詐称気味の印象があり、難易度表の傾向が読み取れるような気がします。
 (新曲およびCarry Me Awayについては、とりあえず触ったきりになっているプレイヤーが多いためか、難易度推定にブレが生じている可能性があります。)

まとめ

イロレーティングとロジスティック回帰で客観的な☆12難易度表を作れた(かもしれない)

今後やりたいこと

・難易度表でAA=12.0と設定するのが妥当かどうか、☆11の難易度を推定することで評価してみたい

・サンプルが充分そうなら☆11以下の難易度表も作りたい

・公式CSVをインポートすると、推定レートや推定順位、リコメンドやランプ更新確率を表示してくれるwebサービスを作りたい

宣伝

僕も所属する音ゲー情報本サークルAA(A)AAAをよろしくお願いいたします。この記事のような音ゲーに関するちょっと踏み込んだ検証を行っています。既刊はこちらからどうぞ。

本記事についてのご意見・ご感想はTwitter:@rice_Placeまでお寄せください。

それでは、良き音ゲーライフを。



この記事が気に入ったらサポートをしてみませんか?