見出し画像

【テクノロジーの話】【将棋の話】将棋AIの進化についてのまとめ


黎明期(1970-90年代)

 序盤中盤は不安定で、終盤だけが強い

水平線効果

 このころのソフトウェアは、ある局面からN手後の局面までを全探索し、各局面の価値を評価関数を用いて評価することで、評価値の高くなる候補手を選んでいました。
 そうすると、水平線効果により、とんでもない悪手を指してしまうことがあります。
 水平線効果とは、有限深度Nで探索を打ち切ってしまうために、長期的に見て問題のある選択をしてしまうという、人工知能特有の問題です。

内藤将棋。序盤は組み込まれたデータベース通りに進む。人間がソフトの手順を見切ってトラップを仕込めば最短15手で勝てた。

 水平線効果は、「コンピュータが年々進化し、その計算能力向上を生かす」とか、「将棋の実力がより高い人が評価関数をチューニングする」という方法で改善されていきます。
 チューニングとはつまり、「無駄な手を候補から外して、有力な手に絞って深堀りする」ことで、探索深度Nが増えました。

金沢将棋。1990年代に最強を誇った将棋プログラム。開発者自身がアマチュア高段者で、効果的なチューニングが行われていた。

終盤力

 終盤では、詰め将棋専用のルーチン(=ある局面で詰みがあるかどうかの探索)が有効でした。探索範囲が「王手およびその対応」に限られるため、ソフトウェアにとっては得意な処理になります。

 そのため、詰将棋を解く棋力では、1968年という早い時期にアマチュア三段と認定されていました。週刊誌の企画で人間対コンピュータの詰将棋早解き競争が行われ、日立HITACハイタック5020は人間とほぼ互角の成績だったという記録が残っています(人間側の49勝53敗)。

HITAC5020。国産初の大型機で、IBM 7090並みのスペックを持つ。クロック周波数は0.5MHz。

発展期(2000年代~2015年)

 自分の弱さを認め、強い人をパクって強くなった

機械学習の登場

 2000年代、Bonanzaの成功により、機械学習がブレイクスルーとして脚光を浴びるようになりました。細かく言えば、学習済みデータを教材とした「教師あり学習(プログラムが教師の手を最善手として選ぶようにチューニングする手法)」を実装したということになります。

 吉沢亮主演の映画『AWAKE』は、このころのお話。

ここから先は

1,830字 / 5画像

¥ 150

この記事が参加している募集

貴重なお時間を使ってお読みいただき、ありがとうございました。有意義な時間と感じて頂けたら嬉しいです。また別の記事を用意してお待ちしたいと思います。