見出し画像

ほんのわずかな不確実さのもたらす決定的な差

いま流行りの AI 技術の基礎を学習している(CS50 AI コース@HarvardX)。

『Q 学習( https://ja.wikipedia.org/wiki/Q学習 )』と呼ばれる仕組みをつかって、”Nim” という石取りゲームの類を解いている(英文 wiki ではマッチ棒の取り合いになっている)。

https://en.wikipedia.org/wiki/Nim

この Nim は “misere (= misery)” なゲームだそうだ。

成程、10000 回も Q 学習で教師なし学習させてやれば、後手が 100 % 勝つ AI が育つ。

つまり 10000 回も試行して訓練すれば、コンピューターには十分な学習で、完全に打ち筋を読み切って後手必勝となる。

でも、此処にわずかな確率、たとえば 5% でもランダムな手を選択する不確実性を組み込んでやる(ε-Greedy 法のε= 0.05 と設定してやる)。

そうすると、結果の勝敗にドラスティックな変化が現れるのだ!!

ここから先は

1,591字

¥ 150

この記事が気に入ったらサポートをしてみませんか?