見出し画像

グアナコってなに?Guanaco: LLaMA 7B に基づく多言語モデルを試す

特徴

  • LLaMA 7B モデルに基づいて構築された高度な命令に従う言語モデル

  • Alpaca モデルの最初の 52K データセットを拡張し、追加の 534K+ エントリでトレーニング実施

  • 多言語対応:英語、簡体字中国語、繁体字中国語 (台湾)、繁体字中国語 (香港)、日本語、ドイツ語

  • システムプロンプトとの正確な外部知識の統合

  • マルチターン対話が可能

  • ライセンスはgpl-3.0

Text-generation web UIの modelsフォルダーにモデルをコピーして、お手軽に試すことができました。

感想ほか

  • VRAM消費は13MB弱くらい

  • LLaMa-7Bと同じく推論はサクサク返ってきます

  • 多言語対応ということで少し期待していたのですが、自分のプロンプトの与え方が悪かったのか、日本語だとほぼ意味がある会話になりませんでした。どんどん目が肥える自分が怖い。🤔

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?