人気の記事一覧

Vision Language Model の 技術詳細と推論と学習

3週間前

Google Colab を使って Llama 3 のファインチューニングを試してみました/大塚

11日前

Google Colab で SFTTrainer によるLLMのフルパラメータのファインチューニングを試す

7か月前

DPO による Llama 2 のファインチューニング

8か月前

Google Colab で SFTTrainer によるLLMのフルパラメータの指示チューニングを試す

7か月前

DRLX による Stable Diffusion の RLHF を試す

8か月前

Google Colab + trl で SFT のQLoRAファインチューニングを試す

8か月前

Google Colab + trl で LINE の japanese-large-lm のQLoRA ファインチューニングを試す

8か月前

Google Colab + trl で RLHF で使う Reward Model の学習を試す

8か月前

24GB GPU で 20B LLM の RLHF ファインチューニング

11か月前

Google Colab + trl で DPO のQLoRAファインチューニングを試す

8か月前

TRLのコンセプトとテックベンチャーの成長予測(🍊)