ログイン
会員登録
言語モデル最適化
書いてみる
関連タグ
#コサインアニーリング (1)
#スケーリング法則 (11)
#データセット (847)
#トランスフォーマーモデル (51)
#トレーニング (56,048)
#モデル (13,068)
#学習率 (18)
人気
急上昇
新着
定番
有料のみ
1件
人気の記事一覧
Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations
Ikemen Mas Kot
2か月前