ついに人知を超えたか・・・?【宝石の煌めきAI】
これまで、宝石AIの強化学習をコツコツ続けて、パラメータ調整した結果、ここ最近本当に強くなってきている。
定期的に筆者自らAIと対戦して、ざっくり強さを確かめて、以前までは、3回に1回負けるくらいだったが、ここ数日間で7戦全敗と全く勝てなくなった。
しかも、その7戦とも筆者が先手番にも関わらず、である。先手が有利と言われている宝石の煌めきで、7戦とも先手番で7連敗するというのは相当のことだ。
とあるAI戦にて
とあるAI戦で、身の毛のよだつ一幕があった。
下図は先手筆者(P0)対、後手AI(P1)のAI手番の盤面である。
ここで、AIは1行目のデッキトップ予約を選択してきた。これまでのAI対戦では、邪魔キープをされることはあったが、デッキトップ予約はなかった。しかも筆者が見ても、1行目には当面買えそうなカードがなく、確かに上級者ならやりかねない手だという印象。
ついに人間みたいな手を選ぶようになってきて、不気味に思えてきた。
なお筆者は、この一手で、AIに高コスパ緑を引き当てられ、結果的に12-16で大敗を喫した。
正直、負けた時の感触が、BGAのレート600代の猛者に負けた時と同じで、気づいた時には買えるものがなくなっていて、どこで間違えたのかがわからないという感覚だ。
局後のAI解析
どこで形勢に差が生まれたのか、対戦相手のAI自身に聞いてみることにした。
下の図が、手番ごとのAIによる評価値である。+1に近いほど先手(筆者)が優勢で、-1に近いほど後手(AI)が優勢ということを表している。これをみると、AIが選んだ29手目によって、形勢が大きくAI側に寄っていることがわかる。
29手目はAIが選んだ下図1行3列の青購入で、AI側は黒を1個支払うだけで購入でき、その青で予約の緑を買って、スムーズに3行2列の赤4点の購入へ繋げられるため、これがかなり厳しい手という評価になっている。
対戦中も確かにこの1手は激痛だったが、AI自身も自覚して選んできていたと思うと、ゾッとする話である。
ちなみに、このAIは読み局面数6400、MCTSのパラメータは、CPUCT=1.0、FPU=0.1としている。これらのパラメータを変えて、急激に強くなったという経緯がある。
次回以降は、この辺りのパラメータ周りの説明をしようと思う。
そろそろ、このAIとBGAの猛者たちを戦わせてどこまでやれるか実験しても良い頃か・・・。ブラウザ上の盤面情報をどうやって素早くAIに入力するかを考えねば。
この記事が気に入ったらサポートをしてみませんか?