最近のLLMの学習法のまとめ - SFT・RLHF・RAG
最近のLLMの学習法 (SFT・RLHF・RAG) をまとめました。
1. 教師ありファインチューニング (SFT : Supervised Fine-Tuning)
2. 人間のフィードバックからの強化学習 (RLHF : Reinforcement Learning from Human Feedback)
3. 検索拡張生成 (RAG : Retrieval Augmented Generation)
4. ベンチマーク
5. データセット
関連
この記事が気に入ったらサポートをしてみませんか?