「#TRL」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

Vision Language Model の技術詳細と推論と学習

4か月前

22

Google Colab を使って Llama 3 のファインチューニングを試してみました／大塚

4か月前

17

Google Colab で SFTTrainer によるLLMのフルパラメータのファインチューニングを試す

11か月前

34

DPO による Llama 2 のファインチューニング

1年前

41

Google Colab で SFTTrainer によるLLMのフルパラメータの指示チューニングを試す

11か月前

18

DRLX による Stable Diffusion の RLHF を試す

1年前

18

Google Colab + trl で LINE の japanese-large-lm のQLoRA ファインチューニングを試す

1年前

25

Google Colab + trl で SFT のQLoRAファインチューニングを試す

1年前

30

Google Colab + trl で RLHF で使う Reward Model の学習を試す

1年前

16

24GB GPU で 20B LLM の RLHF ファインチューニング

1年前

47

Google Colab + trl で DPO のQLoRAファインチューニングを試す

1年前

17

TRLのコンセプトとテックベンチャーの成長予測(🍊)

古賀洋一郎

3年前

3