ログイン
会員登録
有害性低減
書いてみる
関連タグ
#MCTS (5)
#PPO (9)
#RL (265)
#SL (593)
#スコア (891)
#タスク (6,205)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
Constitutional AI: Harmlessness from AI Feedback
Ikemen Mas Kot
1か月前
Don't throw away your value model! Generating more preferable text with Value-Guided Monte-Carlo Tree Search decoding
Ikemen Mas Kot
2か月前