ログイン
会員登録
サブオプティマリティギャップ
書いてみる
関連タグ
#Dagger (9)
#RLIF (1)
#サンプル複雑性 (2)
#タスク (7,455)
#介入 (961)
#報酬関数 (7)
人気
急上昇
新着
定番
有料のみ
1件
人気の記事一覧
RLIF: Interactive Imitation Learning as Reinforcement Learning
Ikemen Mas Kot
6か月前