人間のフィードバック

書いてみる

人気の記事一覧

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

2か月前

Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment

2か月前

Constitutional AI: Harmlessness from AI Feedback

1か月前