人気の記事一覧
Vision Language Model の 技術詳細と推論と学習
Google Colab を使って Llama 3 のファインチューニングを試してみました/大塚
Google Colab で SFTTrainer によるLLMのフルパラメータのファインチューニングを試す
DPO による Llama 2 のファインチューニング
Google Colab で SFTTrainer によるLLMのフルパラメータの指示チューニングを試す
DRLX による Stable Diffusion の RLHF を試す
Google Colab + trl で LINE の japanese-large-lm のQLoRA ファインチューニングを試す
Google Colab + trl で SFT のQLoRAファインチューニングを試す
Google Colab + trl で RLHF で使う Reward Model の学習を試す
24GB GPU で 20B LLM の RLHF ファインチューニング
Google Colab + trl で DPO のQLoRAファインチューニングを試す
TRLのコンセプトとテックベンチャーの成長予測(🍊)