見出し画像

最近のLLMの学習法のまとめ - SFT・RLHF・RAG

最近のLLMの学習法 (SFT・RLHF・RAG) をまとめました。


1. 教師ありファインチューニング (SFT : Supervised Fine-Tuning)

2. 人間のフィードバックからの強化学習 (RLHF : Reinforcement Learning from Human Feedback)

3. 検索拡張生成 (RAG : Retrieval Augmented Generation)

4. ベンチマーク

5. データセット

関連



この記事が気に入ったらサポートをしてみませんか?