人気の記事一覧
LLMの強化学習をLoRAによって効率化する論文紹介
One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models
Fine Tuning LLM for Enterprise: Practical Guidelines and Recommendations
自分の過去ツイートでrinna/japanese-gpt-neox-3.6bをfinetuningして「俺tter」を生成する
Google Colab で Rinna-3.6B のLoRAファインチューニングを試す
Google Colab で OpenCALM-7B のLoRAファインチューニングを試す
rinna-3.6Bをオリジナル小説でLoRAファインチューニングしてみた【RTX3060 (VRAM 12GB)】
StackLLaMA : RLHFでLLaMAを学習するための実践ガイド
24GB GPU で 20B LLM の RLHF ファインチューニング
OpenCALM-7Bをloraで学習して、quantizeするまで
PEFTでLoRAマージしてCTranslate2で遊ぶメモ
Hugging Face PEFTライブラリの紹介①
Google Colab で RedPajama-INCITE のLoRA ファインチューニングを試す
Selective Fine-tuning on LLM-labeled Data May Reduce Reliance on Human Annotation: A Case Study Using Schedule-of-Event Table Detection
Parameter Efficient Fine Tuning: A Comprehensive Analysis Across Applications