SimPLe : Atariゲームのモデルベースの強化学習
以下の記事が面白かったので、ざっくり訳してみました。
・Simulated Policy Learning in Video Models
1. はじめに「深層強化学習」は、視覚的な入力から複雑なタスクのポリシーを学習するために使用でき、Atariゲームで大きな成功を収めています。しかし、多くの最先端のアプローチには、『環境との非常に多くの対話が必要』という制限があります。人間が学習するために必要な対話よりもはるかに多くの対話が必要になります。
人々がこれらのタスクを効