人気の記事一覧

LLMの強化学習をLoRAによって効率化する論文紹介

1か月前

Fine Tuning LLM for Enterprise: Practical Guidelines and Recommendations

自分の過去ツイートでrinna/japanese-gpt-neox-3.6bをfinetuningして「俺tter」を生成する

10か月前

Google Colab で Rinna-3.6B のLoRAファインチューニングを試す

11か月前

Google Colab で OpenCALM-7B のLoRAファインチューニングを試す

11か月前

rinna-3.6Bをオリジナル小説でLoRAファインチューニングしてみた【RTX3060 (VRAM 12GB)】

10か月前

StackLLaMA : RLHFでLLaMAを学習するための実践ガイド

11か月前

Llama 2 論文斜め読み①

9か月前

24GB GPU で 20B LLM の RLHF ファインチューニング

11か月前

OpenCALM-7Bをloraで学習して、quantizeするまで

11か月前

QLoRAで遊ぶメモ

10か月前

PEFTでLoRAマージしてCTranslate2で遊ぶメモ

10か月前

Hugging Face PEFTライブラリの紹介①

9か月前

QLoRAチューニングモデルをAPIから遊ぶメモ

10か月前

Google Colab で RedPajama-INCITE のLoRA ファインチューニングを試す

1年前

PEFTをWindowsから遊ぶメモ

10か月前

ファインチューニングのPEFTについて

Parameter Efficient Fine Tuning: A Comprehensive Analysis Across Applications

InfLoRA: Interference-Free Low-Rank Adaptation for Continual Learning

3週間前

ReFT: Representation Finetuning for Language Models

3週間前