「#量子化」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

いちばんやさしいローカル LLM

1か月前

462

ローカルLLMの長文推論、メモリ使用量を節約する方法:KVキャッシュの量子化

4日前

19

BitNet&BitNet b158の実装①

2か月前

55

[Mac]Meta-Llama-3-8Bをgguf変換して量子化してみました

2週間前

4

BitNet&BitNet b158の実装②

2か月前

22

BitNet&BitNet b158の実装③

2か月前

15

【実験】Claude 3 Opusに論文を読ませて、要約させる:BitNetとBMTの比較

2か月前

13

BitNet&BitNet b158の実装④

2か月前

17

スパース推定アルゴリズムと量子化技術による大規模言語モデルのデータ圧縮

2週間前

2

キャリブレーションデータにもっと気を配ろうの話

5か月前

26

BitNetにおけるSTE(Straight-Through Estimator)の実装

2か月前

14

日本語対応の大規模言語モデル（LLM）をローカル環境で試す：VRAM 8GBの挑戦

0〜

割引あり

1か月前

3

【生成AI】入門者としておさえておきたい「大規模言語モデル（LLM）の現状の全体感」（2/3）

200

3週間前

3

BitNet&BitNet b158の実装：参照まとめ

2か月前

7

【ローカルLLM】Mixtral-8x7bをllama.cppで試す

5か月前

18

llama.cppをローカル起動してFastAPIでAPI化

2か月前

3

GoogleColabでHuggingFaceのモデルをGGUFフォーマットに変換🔄／大塚

6日前

4

驚愕の2ビット量子化LLM/GGUF

8か月前

57

Google ColabでQLoRA したLlama-3をMLXモデル(macOS)へ変換する

3週間前

2

BitNetの計算を検討する。

2か月前

2