見出し画像

Gymで強化学習㉒DQN:理論編

前回は、Qネットワークを実装して、その問題点について解説しました。簡潔に言うと、単純にQ関数をニューラルネットワークに置き換えただけだと学習が安定しません。

しかし、その解決方法も見えてきました。その解決方法を体現しているのがDQN(Deep Q-Network)になります。

今回は、DQNで使われている手法が、どのようにQネットワークによるQ学習を安定化させるのかを解説します。


ここから先は

6,210字 / 7画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?