非専門家フィードバック

書いてみる

関連タグ

#エージェント (3,440)

#ディープニューラルネットワーク (3)

#フィードバック (5,496)

#人間 (63,412)

#人間の好み (2)

#報酬関数 (6)

#報酬関数学習 (1)

有料のみ

1件

人気の記事一覧

Deep reinforcement learning from human preferences

1か月前