フォローしませんか?
シェア
LLMの物語生成のテスト(趣味)に使うため「TinyStories」というデータセットを日本語訳したい…
ローカルLLMをAPI的に使う場合は、llama.cpp(GGUF/GGML)が手軽そう。ただ、大きなモデルでは…
Llama系モデルのGPTQ量子化&推論に使用できるパッケージには、AutoGPTQの他に、GPTQ-for-LLaM…
ローカルLLMの量子化フォーマットとしては、llama.cpp(GGUF/GGML)とGPTQの2種類が広く使われて…
数日前、RedditのローカルLLMスレに以下の投稿が上がっていた。Llamaベースの大規模言語モデル…