見出し画像

Gymで強化学習㉕Double DQN:理論編

前回は、DQNを使って月面着陸の環境に挑戦しました。今回は、Double DQNを解説します。

DeepMindは2013年にDQNを発表しまたしたが、その2年後の2015年にDouble DQNの論文を発表しています。

この論文によって、DQNにどのような改良が加えられたのでしょうか。そもそも、DQNにはどのような問題があったのでしょうか。また、その解決方法はどのようなものでしょうか。

これらについて解説します。

ここから先は

8,753字 / 5画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?