昨日? 発表された日本語モデルを、Windows10 につくったconda環境でのText Generation Web UI でとりあえず動かしてみました。
使ったモデルは、ELYZA-japanese-Llama-2-13b-fast-instruct です。
ダウンロード先
transformerで、チェックをいれてみたのが、bf16とauto-devicesの二つ。
chat画面で、chat-instructを選択して会話をしてみました。
ターミナルの表示は以下でした。
もっさりした動きでしたので、量子化されたモデルだともっとサクサク動くかと思います。
とりあえずやってみた~ という報告です。
#AI #AIでやってみた #やってみた #huggingface #大規模自然言語モデル