直近の報告
下のツイートのように07/12には評価関数の作成を終えました。
この評価関数の作成方法(詳しいことはNG)は以下のように行いました。
(教師データとepoch1の作成方法はこちらで
確認してください。)
②上記の評価関数(epoch1)にOrqha1018で生成した教師1000万でさらに学習(eta 0.1 lambda 0.9 loop 1 mirror_percentage 50 newbob_decay 0.5)。
あまり良い学習経過ではなかったですが、
電竜戦の予行演習が近づいていたこともあり、(対局数が少ないのと低スペックPCで、mブランチを使っていますが)持ち時間5分、一手5秒追加のルールで水匠2(mブランチ有り)と戦わせたところ、あまり信憑性はないですが4戦全勝という結果(棋譜はこちら)になったので、この評価関数に決めました。
また、電竜戦の第1回予行演習に参加する際はソフトの名前は決まっていたのですが、読み方が決まっていなかったので、いろいろ考えていました。
(ソフト名や読み方などはこちらで確認してください。)
新規参入者ながら電竜戦(第一回・第二回)予行演習に参加させていただきました。両方とも自分の都合上最後まで参加できなかったので次回以降は最後まで参加できるといいなと思っております!
長くなったので?ここまでにしておきます。