ログイン
会員登録
SelfRewarding
書いてみる
関連タグ
#LLM (4,505)
#InstructionTuning (5)
#RLHF (38)
#finetuning (45)
#データ (28,855)
#大規模言語モデル (2,154)
人気
急上昇
新着
定番
有料のみ
3件
人気の記事一覧
LLMによる合成データ(Synthetic Data)生成のテクニック
はち
1か月前
31
論文メモ: Self-Rewarding Language Models
はち
1か月前
10
AIトレーニングに革命をもたらす:自己報酬型言語モデルの出現
0xpanda alpha lab
5か月前
19