人気の記事一覧

LLMの強化学習をLoRAによって効率化する論文紹介

4か月前

One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models

1か月前

Fine Tuning LLM for Enterprise: Practical Guidelines and Recommendations

3か月前

自分の過去ツイートでrinna/japanese-gpt-neox-3.6bをfinetuningして「俺tter」を生成する

1年前

Google Colab で Rinna-3.6B のLoRAファインチューニングを試す

1年前

Google Colab で OpenCALM-7B のLoRAファインチューニングを試す

1年前

rinna-3.6Bをオリジナル小説でLoRAファインチューニングしてみた【RTX3060 (VRAM 12GB)】

StackLLaMA : RLHFでLLaMAを学習するための実践ガイド

1年前

Llama 2 論文斜め読み①

1年前

24GB GPU で 20B LLM の RLHF ファインチューニング

1年前

OpenCALM-7Bをloraで学習して、quantizeするまで

1年前

QLoRAで遊ぶメモ

PEFTでLoRAマージしてCTranslate2で遊ぶメモ

Hugging Face PEFTライブラリの紹介①

1年前

QLoRAチューニングモデルをAPIから遊ぶメモ

Google Colab で RedPajama-INCITE のLoRA ファインチューニングを試す

1年前

PEFTをWindowsから遊ぶメモ

ファインチューニングのPEFTについて

Selective Fine-tuning on LLM-labeled Data May Reduce Reliance on Human Annotation: A Case Study Using Schedule-of-Event Table Detection

2か月前

Parameter Efficient Fine Tuning: A Comprehensive Analysis Across Applications

3か月前