人気の記事一覧

驚異の1ビットLLMを試す。果たして本当に学習できるのか?

2か月前

e5-mistral-7bを蒸留して中程度の大きさの埋め込みモデルを学習する

3か月前

BitNet&BitNet b158の実装②

2か月前

BitNet&BitNet b158の実装③

2か月前

Colabのkerasとtransformers最新版で出る変なエラーへの対処メモ

3週間前

RMBG-v1.4 x Transformers.jsで超高速背景除去 他 / Catch up on AI 2024.3.10

BitNetにおけるSTE(Straight-Through Estimator)の実装

1か月前

LLM の chat_template に気をつけろ!

BitNet&BitNet b158の実装:参照まとめ

2か月前

Megatron-DeepSpeedからHFのTransformersにチェックポイントを変換する

1か月前

Transformers.jsとDepth Anythingで2D画像を3Dへ 他 / Catch up on AI 2024.3.7

WSL2でvLLMをコードを読みつつ試してみる

4か月前

小話: 機械学習系の論文実装で気をつけて読むべきほぼ唯一の箇所, 行列演算

2か月前

WSL2でMedusaを試してみる

3か月前

Google ColabでWhisper large-v3を動かしてみる

6か月前

Microsoft から出た小型モデル Phi-2 を Colab で試す

5か月前

GoogleColabにGoogle ColabにTransformersが標準搭載されました

5か月前

Mistralの日本語ファインチューンモデル、「shisa-7b-v1」をColabで試してみました

5か月前

calm2-7b-chat をColabで試す

6か月前

日本語も意外と理解できるOpenChat-3.5-1210を試す

5か月前