ログイン
会員登録
高速推論
書いてみる
関連タグ
#モデル (13,514)
#CS (3,142)
#GQA (1)
#LLM (5,334)
#MMLU (8)
#TriForce (1)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
TriForce: Lossless Acceleration of Long Sequence Generation with Hierarchical Speculative Decoding
Ikemen Mas Kot
4か月前
3
Dynamic Memory Compression: Retrofitting LLMs for Accelerated Inference
Ikemen Mas Kot
4か月前
1