NNUE無償公開評価関数 最強を目指す

私は将棋ソフト BURNING BRIDGES 作者です。
2024年7月現在、将棋AIの中で特に強いソフトは有償の流れになっており、以前のようにWCSCや電竜戦の上位ソフトが無償で公開されるとは少なくなっています。 これは棋譜生成、学習や棋力計測にかかる資金(ハードやワット-消費電力)および時間が以前より大幅に必要になっており、開発資金の負担が大きくなっていることが要因の一つと考えられます。

無償公開最強ソフト

NNUEの中では tanuki-シリーズの HaoLi が無償の中ではトップと言われています。
開発者や有志の計測等で強さが検証されており、疑いようのない強さです。 以前は水匠シリーズが無償公開されておりましたが、水匠5を最後に無償公開はなくなっています。(水匠10betaが2024年7月10日にやねうら王 GitHub SponsorsおよびFANBOXにて支援者へ公開された)

nnue-pytorch

学習方法にnnue-pytorchというのがあるのですが、nnue-pytorchだと2~3日学習するだけでhaoやLiは越えてしまう(halfkp640x2-8-96等で確認)
今回は通常のやねうら王学習機を用いて強化したいと考えています。

レート計測について

ソフト同士の直接対決。または特定のソフトをbenchとした計測。
今回は「ソフト同士の直接対決」を基にレートを計測します。


計測①

とりま過去に作成し、強そうな評価関数から計測。
第一弾として雷苑-2h039(halfkpe9)=halfkpe9の評価関数。
測定PC 13900K か 7950X3D  / 4t2s(4スレッド2秒)

雷苑-2h039(halfkpe9)_YOv830dev VS hao(tanuki-halfkp-20230508)_YOv8.30dev
①~③の3種類の互角局面集を使用。ほぼ居飛車(棋譜は新しい)。
振り飛車局面は2%未満  fvscale 24/16(それぞれのソフトの適正値)
250局x3  
#訂正 haoのfv_scale最適値は20でした。よって本計測より、もう少しHao側が勝ち星を挙げる可能性があります#

互角①122 21 107
互角②115 20 115
互角③119 21 110
合計 / 750games 356-62-332 51.74% R+12

halfkpe9としては過去最強といえる評価関数。上記条件だとhaoに少し勝ち越し。 今回、haoに少し勝ち越したとはいえ、R+12だと互角程度と判断せざるを得ない。
この評価関数はhalfkpe9の中で最強が証明(追試)されたら
なんらかの形で公開できたらいいなと思っています。



この記事が気に入ったらサポートをしてみませんか?