人気の記事一覧
大規模言語モデルをフルスクラッチする練習 (環境構築ー前処理ー事前学習ーファインチューニングー評価まで)
2年次では、進路ガイダンスの事前指導を行いました。【いわき総合】
【論文瞬読】大規模言語モデルの事前学習における知識獲得メカニズムの解明 - 最新研究の知見
大規模言語モデルの構築の事前学習に使えそうなデータセット(主に日本語系)の整理メモ
パラメータ効率が圧倒的に高いLLM学習手法ReFT(Representation Finetuning)を試してみた。
Chat VectorにならぬCode Vectorは作れるのか
Chat VectorならぬMath Vectorは作れるのか
6-4.ディープラーニングの詳細な説明(深層強化学習等)
BitNetにおけるSTE(Straight-Through Estimator)の実装