サクッとiPhoneでローカルLLMを試す。LLMFarm

2024年4月26日 23:47

MLXやらOpenELMやらのApple製LLMの波に乗るべくiPhone 15 Proを購入したので早速オンデバイスLLMを試してみます。「LLMFarm」というオープンソースなプロジェクトがあるのでこちらを使わせていただきました。

「LLMFarm」：軽量なモデルをiOS/M系Silicon で実行できるライブラリ。機械学習ライブラリ『ggml』と『llama.cpp』をベースにしている。TestFlight経由でデモアプリも配布されており、誰でも簡単にオンデバイスLLMを試せる。

必要なもの: iPhone

1. TestFlightをインストール

『TestFlight』・・・ベータ版アプリケーション配布用アプリ。
iOSアプリケーションは通常、AppStoreの審査を通過しなければリリースはできないが、TestFlightではベータ版を開発者向けにクローズドに提供できる。
※今回のLLMFarmはguimoon氏が配布しています。感謝。

TestFlight経由でLLMFarmがインストールできます。

今回はLLMFarm経由でMistral-7B-v0.1のQ3_K_S（3ビットに量子化したモデル）をインストールしてみます。

（※iPhone 15 ProはRAMが8GBあるので動きますが、それ以下のiPhoneの場合は動かない場合があります。その際はPhi-3-miniを試してみてください。）

Tips:
LLMFarm経由でのダウンロードは低速なので、Macがある場合はHugging Faceから直接ダウンロードして、ケーブルで転送する方が速いです。

モデルごとに会話の開始終了のトークンは異なるのでそれぞれ設定する必要があります。今回はMistral用の設定です。

<s>[INST] {{prompt}} [/INST]

高速化のための設定が推奨されています。

これでオンデバイスでLLMを動かすことができます。
機内モードにして実行してみましょう。

↓チャットの様子。精度は実用的とは程遠い。

Gemma-7BやPhi-3など、Hugging Face上のモデルは直接GGUF形式でDLするとRAMサイズが足りるモデルであれば実行できます。
LLMFarmの[import from file…]からインポートできます。

この記事が気に入ったらサポートをしてみませんか？