人気の記事一覧

GELUとは?GPTが採用する活性化の仕組み

Scaling MLPs: A Tale of Inductive Bias

3か月前