篠澤広SSRで、初回レッスンをどう切り抜けるか

この記事の概要

  • 学園アイドルマスター(以下「学マス」)のプロデュースにおいて、得点の上下ブレが大きいアイドル特性である「やる気」。得点には直接結びつかない元気の伸びを上げるためやる気を上げる、という一見迂遠な努力を経て、最後の最後に元気比例の大ダメージを打つ――。その一発逆転性に担当アイドルを重ねないPはいないだろう。

  • 本稿では、学マスの試験・レッスンシステムをプログラム上に再現することで多数回のシミュレーションを行い、いくつかのデッキを前提として戦略ごとの平均得点や合格率・パーフェクト率などを比較した。

  • またプロデュースアイドルとしては、ブレの大きさを実感しやすい、篠澤広SSR「光景」を選択した。

  • その結果、元気の蓄積が最も困難な初回レッスンでさえ、元気を溜める戦略はgreedyな戦略と比べ多くの観点で優れていることが分かった。

  • また、パーフェクトを取得できたプレイアウトで実際に使われたスキルカードを分析することで、実プレイ上の戦略へのインプリケーションが得られた。

問題設定

以下、学マスは既知とする。「光景」の初期デッキに含まれるスキルカードは以下の通り(カッコ内は強化時)であり、これをデッキAとする。なお、特訓段階は3以上であり、「本気の趣味」は強化後の状態で編入されていることを仮定する。

$$
\begin{array}{|c|c|c|c|c|c|c|}\hline
スキルカード名&枚数&消費体力&スコア&元気増加量&やる気増加量&特殊効果\\ \hline\hline
アピールの基本&2&4(3)&9(14)&-&-&-\\ \hline
ポーズの基本&1&3&2(6)&2(4)&-&-\\ \hline
表現の基本&2&0&0&4(7)&-&-\\ \hline
意識の基本&2&2&0&2&2(3)&-\\ \hline
気分転換&1&5(3)&0&0&-&\begin{matrix}元気の100\%(110\%)分パラメータ上昇、\\体力直接消費\end{matrix}\\ \hline
本気の趣味&1&0&0&5(7)&-&やる気が3以上の場合、元気+4(7)\\ \hline
\end{array}
$$

上記のほかに、開始時メモリー効果などで以下の二枚のいずれかを加えたデッキも調査対象とする。それぞれ、デッキB(A+元気な挨拶)、デッキC(A+えいえいおー)とする。

$$
\begin{array}{|c|c|c|c|c|c|c|}\hline
スキルカード名&枚数&消費体力&スコア&元気増加量&やる気増加量&特殊効果\\\hline\hline
元気な挨拶&1&4(3)&-&-&-&\begin{matrix}元気の110\%(120\%)分パラメータ上昇、\\体力直接消費\end{matrix}\\ \hline
えいえいおー&1&2&-&1(2)&3(4)&-\\ \hline
\end{array}
$$

その他の設定は以下の通り。

  • 「光景」のプロデュースアイテム「みちくさ研究ノート」の効果により、最後の2ターンは体力を1直接消費し、その時点の元気の50%がスコアに加算される。

  • 初回レッスンにはどうやらSPがつかないようなので、ターン数6、クリアを30点、コンプリートを60点に設定した。

  • 簡単のため、カード強化は一段階までとし、その確率を30%と置いた。(ゲーム内設定値が不明であるため)

  • 初期体力は、特訓段階5・true達成で得られる30とした。

分析手法

仮想のプレイヤーを設定して以下の各戦略に基づくカード選択を行わせ、多数回のプレイを終了まで行う(プレイアウト)。この結果得られる各種指標の統計量を用いて、戦略の優劣を議論する。

  1. greedy: 手札の中で最もスコアが高いカードを使用する。

  2. 元気重視: 所定のターンまでは、元気増加量が最も高いカードを使用する。所定ターン以降はgreedyに振舞う。

  3. やる気重視: 所定のターンまでは、やる気増加量が最も高いカードを使用する。所定ターン以降はgreedyに振舞う。

  4. ハイブリッド: 所定のターン1まではやる気重視、所定のターン2までは元気重視、それ以降はgreedyに振舞う。

結果

全体の傾向

上記設定のもと、デッキAに対して20万回のプレイアウトを実施した際のスコア分布は以下の通り。元気を蓄積するターン数が0というのはgreedy戦略であり、元気を蓄積するターンが6というのは一度もスコアを出そうとせず「みちくさ研究ノート」のみでスコアを出そうとする戦略なので、その間に最適な戦略が存在することが推察される。実際、元気蓄積ターン数が4(オレンジの棒)のとき、パーフェクト確率がこの中では最も高くなっている。一方、元気を蓄積する戦略ではスコアが30未満となる確率も一定程度ある。

図1: 元気重視戦略で20万回のプレイアウトを実施して得られる、最終得点のヒストグラム。青・オレンジ・緑の順に元気を蓄積するターン数が増えていく。縦軸は合計を1に規格化してある。

次に、元気重視戦略における、各種統計量の元気蓄積ターン数依存性を表にしたものは以下の通り。

表1:デッキAの各種統計量

最もクリア率(=スコア30点以上)が高いのはgreedyな戦略である一方、パーフェクト率(=スコア60点)はさほど高くなく、また終了後ライフが最も低いため後続のレッスンをこなしていくことを考えると採用しづらい。一方元気を3~4ターン蓄積する戦略では、パーフェクト率も高く、結果としてスコア期待値はgreedy戦略をわずかに上回る。それにしても、デッキA(素の状態)ではパーフェクト率が1割強というままならなさ。

デッキB,Cの場合の同表は以下の通り。元気を蓄積する戦略において、期待値やクリア率・パーフェクト率の改善がみられる。特に、デッキBのパーフェクト率がデッキAと比較しほぼ倍となっているが、これはゲーム終盤に元気比例スコアを出すカードを引く確率が倍になっていることに対応していると考えられる。また、いずれのデッキでも、4ターン元気蓄積+2ターンスコア稼ぎがパーフェクト率の観点では最適戦略となっている。育成の上振れを狙いたい本ゲームにおいては、この戦略を選ぶことに合理性があると言える。

表2:デッキB(A+元気な挨拶)の各種統計量
表3:デッキC(A+えいえいおー)の各種統計量

次に、デッキCにおけるハイブリッド戦略についての結果を示す。直観に反し、「始めにやる気を溜めてから元気を溜め、スコアを出す」戦略は、「やる気上げを意識せず元気を溜め、スコアを出す」戦略に比して全体的に劣後している。これは、やる気を上げるカードである「意識の基本」「えいえいおー」は通常時で元気1、やる気2~3しか上がらない一方、「表現の基本」を使用すれば元気が4増加するため、やる気による元気上昇ブーストでこれを取り返すためにはその後最低2回元気を上昇させなくてはならないことによると推察され、ターン数が少ない初回レッスン特有の現象と考えられる。

表4: デッキCにおけるハイブリッド戦略の各種統計量

戦略へのインプリケーション

前小節までの分析で、元気蓄積4ターン→スコア出し2ターンの戦略が最適であることが分かった。そこで、そのような戦略のもと、パーフェクトが出たプレイアウトで実際に各ターンで選ばれていたスキルカードのヒストグラムを取った結果が以下である。

表5. パーフェクトが出たプレイアウトにおいて使用されたカードのヒストグラム。デッキC・元気重視戦略(元気蓄積4ターン)のもと計測。

うまくいく時はこういうことになるのだ、という結果ありきの数字ではあるが、いくつかの興味深い事象が見て取れる。

  • 元気重視戦略であっても、パーフェクトが出るときはターン1でやる気を上げるカードが使用されることが多い。(このような事象が観察されるにもかかわらず、ハイブリッド戦略のパーフェクト率が上がらないのは興味深い。どんなに上振れ期待のプレイングをしても、そのような手札を引かなければスコアは出ない、ということだろうか。)

  • 「表現の基本」は、ターンを追うごとに使用割合が高まっていく。これはやる気の蓄積に関係していると考えられる。

  • 一方「本気の趣味」は3ターン目に使用される割合が高い。これは、一巡目で優先的に使われているためと考えられる。

そこで逆に、1ターン目でやる気上昇カードを引けない(これはデッキCの場合、確率にして29%程度)という手札トラブルを起こした条件のもと、どうやればパーフェクトを出しうるのかを調べた。

表6. やる気上昇形をターン1で引けない条件のもとパーフェクトを出したときに使用されたカードのヒストグラム。
  • ターン1は表現の基本を使うのがよさそう。それすら引かないときは、潔く諦める。

  • 逆に、アピールの基本は使わない方がいい。アピールの基本をターン1で使うときは、パーフェクトを諦めるつもりで使う。

  • 意識の基本・えいえいおーは2ターン目に使う、かつ強化状態で使わないとパーフェクトは厳しい。(おそらく、「本気の趣味」の追加元気上昇条件である「やる気3以上」と関係していると思われる)

今後の課題

本稿では、手札のみを参照するシンプルな戦略のみを採用した。この拡張として、山札の状況も参照した戦略が考えられる。こうした複雑な戦略を作るためには、本稿のようなルール積み上げに依ると早晩限界を迎えることは明らかであり、機械学習等の手法を採用することが考えられよう。
さらに、あるカードの選択がスコア・体力等に即時的にもたらす影響だけでなく、将来の獲得期待値を変動させる効果を考慮することも考えられる。使用カード選択の評価関数作成に当たっては、一例としてプレイアウトを用いたモンテカルロ囲碁のアルゴリズムが参考になると思われる。
また、本稿ではデッキの自由度が小さいことから初回レッスンに絞った分析を行ったが、最終試験に向けてどういったカードを追加していくのが良いのか、といった観点での研究もあり得る。ただしこの方向性での研究のためには、各スキルカードの出現確率を正確に理解する必要があり、困難が付きまとう。

結論

本稿では、シミュレーションによって篠澤広SSR「光景」のプレイング戦略評価を行った。「初回レッスンはアピールの基本を初手から使っていった方がいい」といった意見も耳にするが、本稿の結論は「4ターン元気を溜め、2ターンスコアを出す戦略がパーフェクト取得の観点からはベスト」である。
ただ、そうは言っても初回レッスンのパーフェクト率は本分析内の最大でも22%しかない。担当アイドルの上振れを信じて疑わないPであればこそ、このままならない状況を受け入れ、広と共にそれを楽しんでほしい。広がままならない状況を楽しんでいるように見えるのは、計算された確率を正しく理解したうえで、それでも多分に残るランダムネスの海をクラゲのように漂っているからではないか。それは諦念ではなく受容であり、忍耐ではなく悦楽なのかもしれない。

後記

同じようなことを藤田ことね「世界一可愛い私」でやってみたところ、プロデュースアイテム(好印象6以上の時好印象+3、スキルカード使用回数+1)なしでもパーフェクト確率が99.98%、クリア確率100%となった。確かに、初手で「よそ見はダメ」を打てればそれだけで39点確定しているわけだし、パーフェクトを確定させてレッスンでは残りターン寝てるプレイングを普段やっている実感にも合う。なんともまぁ、アイドルの個性をゲーム性にうまく落とし込んだゲームだなとつくづく感じる。


この記事が気に入ったらサポートをしてみませんか?