[同人ネタ] 将棋AIの機械学習を始めてみた

そもそもは

前々からやろうとしていたことで、やっと実現し始めました。

ルートは、2022年に「将スタ - 将棋ソフトスタジオ」が出たことです。

これのおかげで、手軽に作って将棋所などで動かせるようになったのが、自分も何かできないだろうか?と考え始めたところです。
で、2023年にはChatGPTの爆発的な流行に乗って将棋ソフト(とりあえず動くもの)をChatGPTだけで作ろうとして一度頓挫していました。
ここから、しばらくはオセロのほうに向かうのですが、2024年6月にChatGPT、Claudeがバージョンアップし以前よりもましなコードを書くようになりました。
なら、もしかしたらとん挫したものが復活できるかも?となったので、実際に試してみました。


そして、無事に動くものができました(そして、利用しているライブラリのバグであろうものも見つけましたw)。

だったらAIもいけるんじゃね?

ということで、ChatGPT 4o、Claude 3.5 Sonnetを使って機械学習させるものを作らせてみました。
そして、今無事に学習しています。

今回は、ランダム対局から色々ざっくりな評価関数を使って1手ごとに評価(報酬/ペナルティ)を与えていく方法をとりました(ChatGPTが考えたともいう)。
お試しで学習させたものでちゃんとCPU戦ができました(上記画像がそれ)。ランダムではない機械学習させたものがちゃんと動くのはちょっとした感動ものです。

ひとまず、最初の目標はありきたりですが、FC「本将棋 内藤九段将棋秘伝」に勝つことです。ソフト対策などは一切せず学習だけでなんとかしていきます。

同人誌出します

ということで、物好きな人たちのためにこれに関する同人誌を出します。
並行で、noteでも出します(ここはすいません、有料で)。

細かいところはこれから詰めますし、以前ここで書いていたオセロにも展開したいので、もう少し時間がかかります。とん挫した話とかは本に載せるのは軽くしておきますが、目的と手段を間違えるとだめだよって意味で書いておきます。

リリース目標は9~10月ということで。イベント的には名古屋コミティアに間に合わせたいな。

他のことをしたい欲が高いですが、こちらもやらないとなのでうまく時間を切り出してやっていこうと思います。
並行で作ってる本もありますので、久々に忙しい感じになってきました。

この記事が気に入ったらサポートをしてみませんか?