LLMの取り扱い

2024年7月4日 16:06

若干、ヒントを書いている

なぜ、CPUで処理をするのか

GPUではなくCPUで処理することを前提で書いている 
一般ユーザーはよいグラボを持っている人は少ないのではないか 
大衆化には程遠いのでCPU処理は重要だと思っている 
ChatGPTなどの主流のサービスはプラットフォームとして提供されているため、ユーザー側のPCのスペックはあまり意識しないで済む 
一方で、ローカルPCで手軽に実行、開発、配布、使用したい

llama.cppでConvertできたLLM

llamaはconvert.py、phi-2はconvert-hf-to-gguf.pyなどダウンロードしてくるデータによって使い分ける 
hfはたぶんhuggingfaceのこと。llama.cppはllamaベースのLLMをコンバートするがphi-2はllamaベースではないが可能だった

llama2(Meta)
rinna
phi-2(Microsoft)
neural-chat(Intel)
EvoLLM-JP-A-v1-7B(Sakana AI)
Gemma(Google)
llama3(Meta)

ConvertしたLLMにPythonでアクセスする

ちょっとアクセスするだけならば、llama-cpp-pythonが手軽かと
アプリに組み込むならばLangChainの方が良さそうだ

llama-cpp-python
LangChain

ここから先は

2,269字

スタンダードプラン

¥500 / 月

初月無料人数制限あり

スタンダードプランの記事へのアクセス権が与えられます。リリース頻度は不定期のためアクセスしたい月だけ加入することをオススメします。また、初月無料のためはじめての方は記事の具合を確かめることが可能です。

スタンダードプランの記事へのアクセス権
メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示

このメンバーシップの詳細

ログイン