RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

 タイトル
『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX)

著者
Steven Kapturowski, Georg Ostrovski, John Quan, R´emi Munos, Will Dabney

概要
これまでの分散学習や優先度付き経験再生を元にRNNベースのエージェントを学習させる。当時のSOTA(Ape-X)の4倍のスコアを出す事に成功した。
モデル名はRecurrent Replay Distributed DQN(R2D2)。


この記事が気に入ったらサポートをしてみませんか?