将棋の形勢評価値についての命題集——価値の根拠について
このエッセイでわたしが言いたいことは、だいたい以下の4つである。
1. 将棋の形勢評価値は、詰みを根拠・基準にしている。
2. 評価値を根拠にして言えるのは、した方がいいこととしない方がいいこと(勧奨)だけである。してはならないことやしなければならないこと(禁止・当為)は含まれない。
3. ある評価値が通用する範囲は、その対局内だけである。
4. 全体の価値の総量が決まってはじめて一手当たりの価値が決められる。つまり、評価値の数値は割合方式によるのであって、積み上げ方式の数値ではない。積み上げ方式とは、例えば、チェスのように駒に得点がつけられていて、この駒を取ったら何点と加算される方式。こういうのは評価値とは言えないし、一手当たりの価値を示してもいない(*)。
(定義) 将棋の形勢評価値とは、その時点で正しい手順で指していった場合にどちらの玉が早く詰むかの可能性を数値にしたもの(可能性を客観的に可視化したもの)である。
(前提1) 将棋のルールはすでに明らかなものとする。
(前提2) 指し手は自由意思を持つ人間とする。
(前提3) 評価値は現存する将棋AIでもっとも優秀なものが出すものとする。
1 形勢評価は、「相手玉を自玉より先に詰ませる」という目的を根拠にしている。
証明 (定義)と(前提1)から導かれる。
将棋はどちらかの玉が詰んだ状態が、その対局の終わりになっているから。Q.E.D.
1.1 よい手とは、相手玉を自玉より先に詰ませる可能性を高める手であり、悪い手とは、自玉を相手玉より先に詰ませる可能性を高める手である。
(*)上位の命題からただちに導かれる命題(数学で言うところの「系」)には、証明をつけていない。
1.11 よい手は指さなければならないものではなく、「有利になりたければ指したほうがよい」というだけのものである。
証明 (前提2)と命題1.1から導き出される。よい手であっても指すかどうかは、指し手の意思で選ぶことが出来る。何かに強制されるものではない。たとえばルールに指すことを強制されるものではない。したがって、「~ねばならない」のではなく、「~したほうがいい」としか言えない。Q.E.D.
*補足 同じ理由を使って逆のことも言える。悪い手は指してはならないものではなく、不利になりたくなければ指さないほうがよいというだけのものである。
1.2 「相手玉を自玉より先に詰ませる」という目的がないと、すべての手が無価値になってしまい(どの手を指しても同じく価値がない)、形勢評価ができなくなる。
1.3 駒を取ることはニュートラルな行為である(行為自体はよいことでも悪いことでもない)。
証明 (前提1)と命題1から導き出される。
駒取りの行為のうち、駒を取ることで自玉の詰みが早まる場合は悪く評価され、相手玉の詰みが早まる場合はよく評価される。駒取り自体に評価値が上下するわけではない。したがって、駒取りの行為自体はよくも悪くもない。Q.E.D.
1.4 二歩、打ち歩詰め、王手放置などの反則手は、悪い行為である(行為自体が悪い)。
証明 (前提1)と命題1から導き出される。
これらは、ルールで指すこと自体が許されない行為となっていて、指した時点で対局が終了し、結果が生じない。対局の外で、ペナルティとして行ったプレイヤーの負けという結果が出る。したがって、形勢評価とは何の関係もないことから、これらは行為自体が悪い。Q.E.D.
*補足 反則は、他のゲームでも、スポーツでも、行われた時点でそのゲームが破局されない場合(サッカーでボールが手に当たったなど)は、その結果が反映されないような処置がとられる。例えば、反則の行われたすぐ前の状態に戻って(できるだけその状態に近い状態を作って)プレイのし直しがされる。反則行為が行われずゲームが進行した状態に戻す——あるいはそういう状態にできるだけ近づける処置がとられる。反則は、ゲームの中から行為自体が抹消される行為である。存在しないようにされる行為である。
1.41 二歩、打ち歩詰め、王手放置など反則手は、指してはならないものである。
証明 命題1.4から導き出される。指し手の意思に関係なく、ルールで指すことが禁止されている手だからである。Q.E.D.
2 詰みまでの手をすべて読み切った時点で、評価値は先手・後手いずれかが100%となる。
証明 手の分岐が少ない「動物将棋」の場合は、形勢評価ははじめの時点で後手100%である。すべての手の分岐がすでに網羅されていて、正しい手順に従えばかならず後手が勝つことが明らかになっている。本将棋の場合でも、これと同じことが言えるはずである。Q.E.D.
2.1 評価値がこちらに100%に傾いた状態からでも、負けることがある。
証明 (前提2)と(命題1.11)と(命題2)から導き出される。
評価値が100%の状態とは、正しい手順で指し続ければ勝てる状態である。しかし、指し手が間違えて悪手を指す場合があり、また、何らかの理由でわざと悪手を指すこともあり得るから。Q.E.D.
2.2 現在の将棋AIは、本将棋の手の分岐をすべて読みきっているわけではない。
証明 (前提3)だとすると、もし、対局前にすべての手の分岐を読み切っているなら、「動物将棋」と同じく、一手目を指す前からどちらが勝つかを判断できる(はじめから、先手・後手のいずれかの評価が100%になる)。しかし、本将棋ではそうなっていない。したがって、現在の将棋AIは、本将棋の手の分岐をすべて読みきっているわけではない。Q.E.D.
2.21 現在の形勢評価値はいくらか信用できないものである(可能性を示すものでしかない)。
証明 (前提3)だとすると、本将棋の手の分岐をすべて読みきっているわけではない以上、未知の手が存在する。その手は、将棋AIの読みの外側にあり、その未知の手を指された場合、どうなるかはわからない。したがって、今のところ、形勢評価値はいくらか信用できないものであり、可能性を示すものでしかない。Q.E.D.
3 ある対局の形勢評価値はその対局の中だけで通用する数値である(べつの対局の形勢評価には使えない)。
証明 「相手玉を自玉より先に詰ませる」という場合の相手玉・自玉は、その対局での相手玉・自玉のことである。どんな手でも、形勢評価に影響を与えられるのはその対局のみで、ほかの対局の形勢に影響を与えない。したがって、ある対局の形勢評価値は、その対局の中でだけ通用する数値である。Q.E.D.
*補足 たとえば、ある対局で+10%と評価された手が、ほかの対局の似たような局面で+10%だったとしても、たまたま数値が同じだっただけである。その+10%は、その対局での相手玉の詰みを早めた数値でしかない。その手を指すことで別の対局の相手玉の詰みを早めたわけではない。
3.1 それぞれの対局はそれぞれ別々の閉じた世界である。
3.2 全体の価値を詰みまでの一局のうちに限定することで、部分である一手の価値が決定できている。
証明 命題1と命題3から導き出される。
形勢評価値の最高は一局の詰みの100%のときである。一手の評価値は、その一手でどれだけ詰みに近づけているかを算出している。一手の単位を決めてそれを積み上げているのではない。したがって、全体の評価をどの程度動かしたかによるのが一手の評価となる。Q.E.D.
*補足 逆に、局をまたいで使えるような一手の単位を決めた場合を考えてみる。たとえば、手の上手さで評価した値を設定したとする。すると、玉の詰みが近い側が高い評価値を得ている場合が発生する。形勢が測定できない。
それは本当か?
これはそもそも無理のある仮定だったかもしれない。第一に、この数値は上手い手を指した度合いを算出したものであって、形勢を算出したものではないのだから、形勢が測定できるわけがない。第二に、「上手い手」とはどのような手か? 相手玉の詰みを早めるような手のことでよいのか? たとえば、こちらが大して上手い手を指しているわけでもないのに、相手がとても下手な手を指して自滅したような場合、終わりの方のこちらの平凡な手の評価がとても高く算出されることになってしまうのか?
この記事が気に入ったらサポートをしてみませんか?