指し込み考察 2

気づいたら前回から2週間経ってました。
noteは書きたいときに書く方針なので、また次も遅くなるかもしれませんし明日書くかもしれません。
覚えていらっしゃる方がいるか分かりませんが、懲りずに前回の続きです。

止めるタイミングを
a. 毎日3局
b. 勝てるまで指す
c. 負けるまで指す
d. 勝ち越すまで指す
とする指針の下で、勝率の変動を仮定して勝ち越し数の期待値を計算する考察です。

2.「勝率が高い日」と「勝率が低い日」がある

将棋にはなんとなく、調子がいい日と悪い日がある気がします。
日によって勝率が決まるとしたらどうでしょうか。
考察を簡単にするために、勝率0.4の日「勝てる日」と勝率0.6の日「勝てない日」がちょうど半々だとします。

期待値については、いわゆる「和の期待値は期待値の和」を使います。これを使えば、1局毎の期待値を計算すればそれを足すだけで1日の期待値が計算できそうです。多分。ダラダラ計算が続くので、面倒な方は最後までとばしてください。

a.毎日3局
勝てる日は、1局の勝ち越し期待値は、0.6 + (-0.4) = 0.2
勝てない日は、-0.2
よって勝ち越し期待値は0。

b.勝てるまで指す
勝てる日は
1局目は0.2
2局目は1局目に負けた場合のみあるので、0.4×0.2
3局目は2局目も負けた場合のみあるので、0.4×0.4×0.2
・・・
と続くので、合計は
0.2 × (0.4)^n を n = 0~∞ で合計して1/3 = 0.3333…
勝てない日は
1局目は-0.2
2局目は1局目に負けた場合のみあるので、0.6×(-0.2)
3局目は2局目も負けた場合のみあるので、0.6×0.6×(-0.2)
と続くので、合計は
-0.2 × (0.6)^n を n = 0~∞ で合計して-1/2 = -0.5
1日の勝ち越し期待値は(1/3-1/2)/2 = -1/12 ≒ -0.08

c.負けるまで指す
勝てる日は
1局目は0.2
2局目は1局目に勝った場合のみあるので、0.6×0.2
3局目は2局目も負けた場合のみあるので、0.6×0.6×0.2
・・・
と続くので、合計は
0.2 × (0.6)^n を n = 0~∞ で合計して1/2 = 0.5
勝てない日は
1局目は-0.2
2局目は1局目に負けた場合のみあるので、0.4×(-0.2)
3局目は2局目も負けた場合のみあるので、0.4×0.4×(-0.2)
と続くので、合計は
-0.2 × (0.4)^n を n = 0~∞ で合計して-1/3 = 0.3333…
1日の勝ち越し期待値は(-1/3+1/2)/2 = 1/12 ≒ 0.08

d.勝ち越すまで指す
貧弱な数学力では計算方法が分かりませんでした。
仕方ないのでそれっぽいコードを書いてPCにやらせることにしました。

画像1

見ての通り、ド素人です。プログラミングの授業2回目くらいで書けそうです。無限に続く可能性があるので100回で切ってます。
p = 0.4,0.6 の時の値はそれぞれ
-7.3524
0.9953
でした。4,5回くらいまわしてみても大体これくらいになりそうです。
ということで、期待値(推測値)は
(-7.3524 + 0.9953) / 2 = -3.67855 ≒ -3.68
もちろんガバガバコードですし間違ってたら教えてもらえるとありがたいです。

「勝率が高い日」と「勝率が低い日」がある 結論

c (0.08) > a (0) > b (-0.08) >> d (-3.68)
dは100局で止めてるので、もっと負ける可能性もありそうです。
もちろん、1日100局以上指すのは相当大変ですが。
僅かな差ですが、この理論の下では「負けるまで」が良さそうに見えます。

ちなみに、「1局目に勝った時、その日勝率が高い確率」は、条件付き確率の計算で
0.5 × 0.6 / 0.5 × 0.6 + 0.5 × 0.4 = 0.6 となります。
「1局目に勝ったら今日は調子がいいから指しまくる」はありなのかも?

今回はここまでです。

この記事が気に入ったらサポートをしてみませんか?