フォローしませんか?
シェア
llama.cppのCPUオンリーの推論について CPUでもテキスト生成自体は意外にスムーズ。なのに、…
2023/12/05:llama.cppが「Qwen」に対応したので試しました。 「Qwen」は中国Alibabaグループ…
llama.cppに「Speculative Sampling(投機的サンプリング)」という実験的な機能がマージされ…
先日の記事に続き、ウェブUI用のPythonライブラリ「gradio」を使って、簡単なチャットボットを…
Metaがコーディング用の言語モデル「Code Llama」をリリースした。 7月に公開済みのLlama-2を…
RedditのローカルLLM板に以下の投稿があった。週明けに「llama.cpp」で使われているGGMLファイ…