Llama3-8Bやphi3-miniなど小型モデルの弱点をDifyで解決する

2024年4月27日 21:45

今回はこんなんでやると便利だよというだけの話です。

小型LLMの弱点

Llama3-8Bやphi3-miniなど小型でありながらGPT3.5以上、GPT-4にも迫る勢いのLLMが登場しだしました。小型なので、ローカルでの動作が容易で、私のMac（Intel系なのでGPUも使えず、16GBしかメモリを搭載していない）でも動きます。

しかし、高い精度は「英語」でのやりとに限定されます。非英語で行うと極端に性能が下がります。

Difyで解決

そこでオープンソースのDifyです。クラウド版は回数制限ありの有料となっていますが、DockerとOllamaを使ってローカルで動かせば無料で無制限に使えます。

若干見にくいですが、「開始」で私の入力を待ちます。
私は日本語で入力します。

（1）私の入力がLLM1に送られます。
このLLMのシステムプロンプトは「日本語→英語」のプロの翻訳家です。
ここでの出力は英語です。

（2）英語の翻訳結果はLLM2に送られます。
このLLMのシステムプロンプトは「優秀なAI」です。英語なので高精度で処理されます。
ここでの出力は英語です。

（3）その出力がLLM3番に送られます。
このLLMのシステムプロンプトは「英語語→日本語」のプロの翻訳家です。
ここでの出力は日本語です。

（4）最終的な結果がチャットに表示されます。

とまあこのようにDifyで一連のワークフローを組めば手間なく小型モデルの弱点を解決できます。お試しあれい。

この記事が気に入ったらサポートをしてみませんか？