見出し画像

グアナコってなに？Guanaco: LLaMA 7B に基づく多言語モデルを試す

2023年4月19日 23:29

特徴

LLaMA 7B モデルに基づいて構築された高度な命令に従う言語モデル
Alpaca モデルの最初の 52K データセットを拡張し、追加の 534K+ エントリでトレーニング実施
多言語対応：英語、簡体字中国語、繁体字中国語 (台湾)、繁体字中国語 (香港)、日本語、ドイツ語
システムプロンプトとの正確な外部知識の統合
マルチターン対話が可能
ライセンスはgpl-3.0

Text-generation web UIの modelsフォルダーにモデルをコピーして、お手軽に試すことができました。

感想ほか

VRAM消費は13MB弱くらい
LLaMa-7Bと同じく推論はサクサク返ってきます

多言語対応ということで少し期待していたのですが、自分のプロンプトの与え方が悪かったのか、日本語だとほぼ意味がある会話になりませんでした。どんどん目が肥える自分が怖い。🤔

この記事が参加している募集

#AIとやってみた

31,269件

この記事が気に入ったらサポートをしてみませんか？