今回は某ブログに投稿した構築作業後の出力結果に関する補足記事。
さてInte GPUであるARC A770は、ともかく出力(生成)することは可能となっている。4bit版Command R+ 104B版は実現できていないが、とりあえず4bit量子化版の出力結果を貼っておく。-n や-eを取り除くことにより、とりあえず途中で停止するような事象は発生していない。
(Command R+を使えなくても既存NVIDIA GPU並みの性能を出せたら、自分的には二枚刺しにして32GB環境でPytorchという可能性もある。幸い我がASrock Z370 Taichiはコンシューマー向けマザーボードとしては特別仕様なのだ。二枚刺しした時、8 x 2 と二枚が同じ通信速度でPCIeスロット経由で通信できるのだから)
ZES_ENABLE_SYSMAN=1 ./build/bin/main -p "ドラゴンボールに登場する亀仙人を紹介してく ださい" -ngl 5 -mg 0 -m ./models/DataPilot-ArrowPro-7B-KUJIRA-Q4_K_M.gguf
なお上記はVRAMオフロードを-ngl 5に制限した時の値である。特に制限しない時には下記となった。これは何か設定を間違えているのか、単にモデルのサイズが小さいからGPUもCPUも関係ないのかは不明である。引き続き検証作業を継続することが望ましいようだ。
ZES_ENABLE_SYSMAN=1 ./build/bin/main -p "ドラゴンボールに登場する亀仙人を紹介してく ださい" -mg 0 -m ./models/DataPilot-ArrowPro-7B-KUJIRA-Q4_K_M.gguf
それにしてもnvidia-smiのようなコマンドが現時点でも存在しないようであり、どうもGPUの稼働状況を掴みにくい。仕方がないのでWindows 11環境でも試してみることにしますかな。
(Windows環境だと、タスクマネージャーでIntel ARC A770の稼働状況を把握することが可能)
そういやこちらはCPUのみの出力結果だったように記憶している。ご覧の通りで、GPUがある場合と殆んど生成速度は変わらない。(もう少しCPUやGPUに負荷のかかるモデルを選んだ方が望ましい雰囲気。ま、Windows版で様子を見てみますか)
それでは今回は、この辺で。ではまた。
------
記事作成:小野谷静(オノセー)