ログイン
会員登録
自己注意
書いてみる
関連タグ
#モデル (14,347)
#ChatGPT (85,147)
#TSE率 (1)
#transformer (311)
#わたしの勉強法 (4,140)
#アルゴリズム (3,338)
人気
急上昇
新着
定番
有料のみ
4件
人気の記事一覧
ChatGPTの仕組み(いつものAttentionの論文)をメタファーと数式と図解と用語集であらわす
Yuki
6日前
18
🦜トランスフォーマーモデルは順伝播逆伝播どちらにより新規性がありましたか?
あたり帳簿
9か月前
1
Conv-Basis: A New Paradigm for Efficient Attention Inference and Gradient Computation in Transformers
Ikemen Mas Kot
5か月前
Why "classic" Transformers are shallow and how to make them go deep
Ikemen Mas Kot
6か月前