「#量子化」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

BitTransformer界隈に激震!ついに使える乗算フリーLLMが登場!?

2か月前

85

いちばんやさしいローカル LLM

5か月前

505

オーディオの量子化 bit 深度は何 bit 必要なのか？

1か月前

22

【論文瞬読】多言語AIの公平性を考える：大規模言語モデルの量子化が与える影響とは

2か月前

18

ローカルLLMの長文推論、メモリ使用量を節約する方法:KVキャッシュの量子化

3か月前

23

「量子化」の意味が分かった音楽家

しらせえす

2か月前

9

Stable Diffusionのモデルを量子化して画像生成する

2か月前

9

BitNet&BitNet b158の実装①

6か月前

55

覚え書き：Hugging face 上でモデルの量子化が実行できそうです

1か月前

4

[Mac]Meta-Llama-3-8Bをgguf変換して量子化してみました

4か月前

7

BitNet&BitNet b158の実装②

6か月前

22

次回のnoteの更新（金曜日くらい）で、Stable Diffusionの量子化を試した結果を公開するので、興味があったら見に来てください。

2か月前

3

【実験】Claude 3 Opusに論文を読ませて、要約させる:BitNetとBMTの比較

6か月前

13

BitNet&BitNet b158の実装③

6か月前

15

色々なライブラリでLLMを量子化してみる

2か月前

6

BitNet&BitNet b158の実装④

5か月前

18

llama.cppでHuggingFaceモデルを4bit量子化😚【GoogleColab】／大塚

3か月前

15

量子化LLMが描く未来 - 効率、倫理、そして信頼性の向上へ

2か月前

7

Stable Diffusionのモデルを量子化(Q8)して推論した結果がこちら・・・ 1step: 8秒(512*256) * 16STEPなので、おおよそ2分/枚で作成される。もちろん、GPUは使用していない。画像のサイズで生成時間が大きく変動。CPUで変わるかは気になる

2か月前

2

スパース推定アルゴリズムと量子化技術による大規模言語モデルのデータ圧縮

4か月前

2

キャリブレーションデータにもっと気を配ろうの話

8か月前

26

BitNetにおけるSTE(Straight-Through Estimator)の実装

5か月前

14

【生成AI】入門者としておさえておきたい「大規模言語モデル（LLM）の現状の全体感」（2/3）

¥200

4か月前

3

CommandR+量子化の簡易比較テスト(dranger氏のtxtを使用)追記ローカルでのiq1_sテスト

5か月前

3

【ローカルLLM】Mixtral-8x7bをllama.cppで試す

9か月前

18

BitNet&BitNet b158の実装：参照まとめ

6か月前

7

llama.cppをローカル起動してFastAPIでAPI化

6か月前

3

The Unreasonable Ineffectiveness of the Deeper Layers

3か月前

2

日本語対応の大規模言語モデル（LLM）をローカル環境で試す：VRAM 8GBの挑戦

¥300

5か月前

2

Google ColabでQLoRA したLlama-3をMLXモデル(macOS)へ変換する

4か月前

3

GoogleColabでHuggingFaceのモデルをGGUFフォーマットに変換🔄／大塚

3か月前

8

第二量子化を波動関数の量子化だと思ってる方へ

5か月前

2

驚愕の2ビット量子化LLM/GGUF

1年前

58

16GBのVRAMで4bit量子化版のCommand R+ 104B版を動作させる

小野谷静@オノセー

5か月前

2

QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead

3か月前

1

Fine Tuning LLM for Enterprise: Practical Guidelines and Recommendations

5か月前

2

Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training

3か月前

1

CALM2-7BをAWQで4bit量子化＆高速推論

10か月前

13

AutoGPTQ と transformers によるLLMの軽量化

1年前

60

git pull というコマンドとQwenの実行：mlx-exampleにて

8か月前

7

QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving

4か月前

1

りんえもんに聞く(Google Colabコード付)／不破静六

4か月前

11

Low-Cost Language Models: Survey and Performance Evaluation on Python Code Generation

4か月前

1

あなたの「もしもし」がデジタルデータに変換される！VoIPのA/D変換

松井真也＠登録セキスペ

6か月前

1

【7問】アナログ-デジタル変換のデータ量計算（FE計算シリーズ）

5か月前

5

【ローカルLLM】Llama 2のコンテキスト長を15Kトークン超に拡大する

1年前

29

光りろん研究室！ B4輪講第3回(密度演算子、電磁場の量子化、第二量子化)

光と物質の量子論研究室 @ 横浜国立大学 / BAMBA Motoaki 馬場基彰

4か月前

1

東京大学の松尾研究室の100億パラメータのLLM「weblab-10b」の実行方法

1年前

19

【ローカルLLM】Llamaモデルのコンテキスト拡張について整理する

1年前

9

シュッとLLM を 2ビット量子化できるらしい QuIP というのをチラ見した

1年前

7