AutoModelForCausalLMのquantization_configに渡すことで量子化する

書いてみる

人気の記事一覧

Google ColabでQLoRA したLlama-3をMLXモデル(macOS)へ変換する

3か月前