ログイン
会員登録
AgentBench
書いてみる
関連タグ
#AgentBoard (1)
#BBH (4)
#Claude (809)
#CodeLlama (22)
#Dolly (16)
#Falcon (57)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
Observational Scaling Laws and the Predictability of Language Model Performance
Ikemen Mas Kot
3週間前
AgentBench: Evaluating LLMs as Agents
Ikemen Mas Kot
10か月前