見出し画像

ついに人知を超えたか・・・?【宝石の煌めきAI】

これまで、宝石AIの強化学習をコツコツ続けて、パラメータ調整した結果、ここ最近本当に強くなってきている。
 定期的に筆者自らAIと対戦して、ざっくり強さを確かめて、以前までは、3回に1回負けるくらいだったが、ここ数日間で7戦全敗と全く勝てなくなった。

しかも、その7戦とも筆者が先手番にも関わらず、である。先手が有利と言われている宝石の煌めきで、7戦とも先手番で7連敗するというのは相当のことだ。

とあるAI戦にて

とあるAI戦で、身の毛のよだつ一幕があった。
下図は先手筆者(P0)対、後手AI(P1)のAI手番の盤面である。

ここで、AIは1行目のデッキトップ予約を選択してきた。これまでのAI対戦では、邪魔キープをされることはあったが、デッキトップ予約はなかった。しかも筆者が見ても、1行目には当面買えそうなカードがなく、確かに上級者ならやりかねない手だという印象。
 ついに人間みたいな手を選ぶようになってきて、不気味に思えてきた。

なお筆者は、この一手で、AIに高コスパ緑を引き当てられ、結果的に12-16で大敗を喫した。

正直、負けた時の感触が、BGAのレート600代の猛者に負けた時と同じで、気づいた時には買えるものがなくなっていて、どこで間違えたのかがわからないという感覚だ。

局後のAI解析

どこで形勢に差が生まれたのか、対戦相手のAI自身に聞いてみることにした。
下の図が、手番ごとのAIによる評価値である。+1に近いほど先手(筆者)が優勢で、-1に近いほど後手(AI)が優勢ということを表している。これをみると、AIが選んだ29手目によって、形勢が大きくAI側に寄っていることがわかる。

評価値推移(横軸:手番数、縦軸:評価値)

29手目はAIが選んだ下図1行3列の青購入で、AI側は黒を1個支払うだけで購入でき、その青で予約の緑を買って、スムーズに3行2列の赤4点の購入へ繋げられるため、これがかなり厳しい手という評価になっている。

対戦中も確かにこの1手は激痛だったが、AI自身も自覚して選んできていたと思うと、ゾッとする話である。

ちなみに、このAIは読み局面数6400、MCTSのパラメータは、CPUCT=1.0、FPU=0.1としている。これらのパラメータを変えて、急激に強くなったという経緯がある。

次回以降は、この辺りのパラメータ周りの説明をしようと思う。

そろそろ、このAIとBGAの猛者たちを戦わせてどこまでやれるか実験しても良い頃か・・・。ブラウザ上の盤面情報をどうやって素早くAIに入力するかを考えねば。


この記事が気に入ったらサポートをしてみませんか?