記事一覧
Self-Instructで商用利用可能な日本語インストラクションデータを作成する
Self-InstructについてSelf-Instructは、175個の人間が書いたインストラクションから新しいインストラクションを生成できます。
Stanford Alpacaの実装では、175個の人間が書いたインストラクションから3つをサンプルして、GPT-3に新しいインストラクションを20個生成させています。生成されたインストラクションをROUGEスコアを用いて既存のインストラクションと
Megatron-DeepSpeedからHFのTransformersにチェックポイントを変換する
こちらのプロジェクトでMegatron-DeepSpeedからHFのTransformersにチェックポイントを変換する必要があったので
Megatron-DeepSpeedは、NVIDIAのMegatron-LMをもとにした拡張版で、DeepSpeedライブラリを使用しています。
Megatron-DeepSpeedには、DeepSpeedからMegatron-LMやHugging Face