【テクノロジーの話】【将棋の話】将棋AIの進化についてのまとめ

2022年7月16日 16:45

黎明期（1970-90年代）

　序盤中盤は不安定で、終盤だけが強い

水平線効果

　このころのソフトウェアは、ある局面からN手後の局面までを全探索し、各局面の価値を評価関数を用いて評価することで、評価値の高くなる候補手を選んでいました。
　そうすると、水平線効果により、とんでもない悪手を指してしまうことがあります。
　水平線効果とは、有限深度Nで探索を打ち切ってしまうために、長期的に見て問題のある選択をしてしまうという、人工知能特有の問題です。

内藤将棋。序盤は組み込まれたデータベース通りに進む。人間がソフトの手順を見切ってトラップを仕込めば最短15手で勝てた。

　水平線効果は、「コンピュータが年々進化し、その計算能力向上を生かす」とか、「将棋の実力がより高い人が評価関数をチューニングする」という方法で改善されていきます。
　チューニングとはつまり、「無駄な手を候補から外して、有力な手に絞って深堀りする」ことで、探索深度Nが増えました。

金沢将棋。1990年代に最強を誇った将棋プログラム。開発者自身がアマチュア高段者で、効果的なチューニングが行われていた。

終盤力

　終盤では、詰め将棋専用のルーチン（＝ある局面で詰みがあるかどうかの探索）が有効でした。探索範囲が「王手およびその対応」に限られるため、ソフトウェアにとっては得意な処理になります。

　そのため、詰将棋を解く棋力では、1968年という早い時期にアマチュア三段と認定されていました。週刊誌の企画で人間対コンピュータの詰将棋早解き競争が行われ、日立HITACハイタック5020は人間とほぼ互角の成績だったという記録が残っています（人間側の49勝53敗）。

HITAC5020。国産初の大型機で、IBM 7090並みのスペックを持つ。クロック周波数は0.5MHz。

発展期（2000年代～2015年）

　自分の弱さを認め、強い人をパクって強くなった

機械学習の登場

　2000年代、Bonanzaの成功により、機械学習がブレイクスルーとして脚光を浴びるようになりました。細かく言えば、学習済みデータを教材とした「教師あり学習（プログラムが教師の手を最善手として選ぶようにチューニングする手法）」を実装したということになります。

　吉沢亮主演の映画『AWAKE』は、このころのお話。

ここから先は

1,830字 / 5画像

¥ 150

ログイン

この記事が参加している募集

#将棋がスキ

2,701件

貴重なお時間を使ってお読みいただき、ありがとうございました。有意義な時間と感じて頂けたら嬉しいです。また別の記事を用意してお待ちしたいと思います。