人気の記事一覧

結局 llama.cpp とは何者なのか?

6か月前

手元のPCでggml使って大規模言語モデルRinna/OpenCalm/LINEを動かしてみた件

11か月前

GGMLからGGUFへ:llama.cppのファイルフォーマット変更

11か月前

AITuber構築を目指したllama.cppのサーバー機能など諸々のメモ

11か月前

Metalによるllama2 13B chatの高速実行

11か月前

llama2 70B chat をM1 max 32GB ramのMBP環境で動かす

11か月前

AITuber構築を目指してllama-cpp-pythonを使ってMetal有効化したllama.cppをプログラムに組み込む

11か月前

rwkv.cpp を試す

1年前

CTranslate2でrinna instructionをquantizeして動かす

1年前

OpenCALM-7Bをloraで学習して、quantizeするまで

1年前

rakutenモデルが僕のマシンで動かなかった→動いた

4か月前